WordVBA再び出番か

Wordの標準的書式で、約170ページ、字数17万超の文書があります。内容は、blogコメントを抽出したものです。ひとつのコメントの先頭には、コメントした人の名前と日付が入っています。段落数は当然それぞれ違います。他コメントとの境界には、適宜区切りとして使えそうな文字(例:///////////)を埋めてあります。
さあ、これからが難問です。ダブりを排除せよ!
なにせ、作業経過が複雑で、同じコメントを複数回抽出している可能性が十二分にあるのです。
コメントした人と日付などから、序列番号をつけ、それを配列に読み込んで、日付順に並べてみて、ダブリの可能性があるコメントに何かマークを記入・・・などと考えてみました。
さてぇ、うまくいくのかどうなのか。まず、日付のフォーマットから整形しなくては。ちょっと沈みそうな雰囲気であります・・・・。