« 今日見つけた読めない漢字「不織布」 | メイン | 東工大の桜 »
2007年03月27日
「英辞郎 第三版」のPDICバイナリ形式のデータをrdic用に変換
英辞郎は大変優れた 英語の辞典です.自分は随分前から愛用させてもらっています.
でも,基本的にlinuxを使っているので辞書データをrdic用に変換して使っています.
先日この英辞郎の第三版を購入しました.第三版では辞書データがPDICバイナリ形式という形式に変わっていて,変換にちょっとてこずったのでメモしておきます.
1)Windows用の検索ソフトPDICで1行テキスト形式に変換.この時セパレータに" : "(スペースも含む)を指定する.(作成ファイル名をdict.txtとする.)
2)linuxマシンにデータを持ってきて,以下のように実行.
(cnv2rdic.rbはrdicに付属するスクリプト)
% ruby -Ke cnv2rdic.rb dict.txt | sort -k1,1 -t: -f > dict.euc
3)各行の先頭に"■"を加える.
sed "s/^/■/" dict.euc > dict_2.euc
4)できあがったdict_2.eucをrdicで使う.
dict_2.eucを/usr/share/rdic/dict_2.eucなどにコピーしておいて,
rxvt -e rdic -p -b /usr/share/rdic/dict_2.eucとやればrxvt上で英辞郎が使えるようになります.ウェブ上の英単語をマウスで選択するとすぐに,そのrxvt上に訳が表示されるので結構便利です.ちなみに辞書ファイルが複数ある場合にはファイル名を並べて指定すればオッケイです.rxvtとrdicはVineであればaptでサクッと入ります.
投稿者 yamada : 2007年03月27日 20:23
トラックバック
このエントリーのトラックバックURL:
http://blog2.arazio.net/mt-tb.cgi/79
