contents
|
A 辞書ファイルの変換(QPOBOXで使える形に)
このスッテップがこの山場というか、一番大事な辞書ファイルを作成しないといけません。さいわいにも。QPOBOXの辞書形式は・・・・
a 亜 ai 愛
ao 青 ・・・・・
といったようにローマ字と読み方のTab区切りなので、わかりやすいのです。ただし、普通の辞書ファイルは左側はローマ字ではなく、ひらがなになっている例がほとんどと思いますので工夫が必要です。
医学辞書ファイルは以前たまたま購入した医学辞書にcsvファイル形式のがあったので、それを使うことにしました。他の形式のでもいいと思いますが、それ相応の変換は覚悟の上でやらないといけません・・・。他の日本語辞書はQPOBOX付属のstaticdicを使用しました。
仮に、元のファイル名をJISYO.csvとします。 エクセルでみるとこのようになっています。 この左と真ん中の2列を取り出して、右側の名詞は無視したいところです。
まず、以下のようなperlスクリプトを使って左側部分と、中央部分だけを抽出します
convert1.pl
このconvert1.plというわずか15行にも満たないスクリプトで、見事に「JISYO1」と「JISYO2」というファイルに分割されました。
図のように2列しかない辞書ファイルのお使いの方はconvert1a.plの方をお使いください。
@に戻る Bに進む
|