2008/07/01

正規表現

文献の表記の統一ってのも面倒な仕事のうちの一つ。語の間が半角スペースだったり全角スペースだったり。全角カンマか半角カンマか・・・。外国人名のときは、半角の約物、日本人名のときは全角の約物、というわけでもない。ここらへんは正規表現+スクリプトで対処することで、煩わしさから解放されるはず。

もひとつ問題は、書名または雑誌名はイタリックにして、巻数はボールドとか、いう規定の問題。そもそもデータはワード形式での入稿が多く、ワード上でイタリックにしたりボールドにしたりしてるんだが、基本的には、ワードのスタイルをインデザイン上で読み込みたくないので、いちいち指定し直さないといけない。ちなみに、先頭文字スタイルを駆使することで、イタリック、ボールドの処理はいくぶん楽になる。

ワードのマクロで正規表現使って処理するのが一番真っ当な気がするんだが、VBマクロのリソースがやたら少ない(エクセルは多い)。でもって、VBの文法覚えるのもめんどくさいので、この方向性はなし。

あー、perlのwinOLE(だったっけな)で制御する、という方法もあるのか。もしくはruby。どっちにしろ勉強が必要だわな。

0 件のコメント: