« 今日見つけた読めない漢字「不織布」 | メイン | 東工大の桜 »

2007年03月27日

「英辞郎 第三版」のPDICバイナリ形式のデータをrdic用に変換

英辞郎は大変優れた 英語の辞典です.自分は随分前から愛用させてもらっています.
でも,基本的にlinuxを使っているので辞書データをrdic用に変換して使っています.
先日この英辞郎の第三版を購入しました.第三版では辞書データがPDICバイナリ形式という形式に変わっていて,変換にちょっとてこずったのでメモしておきます.

1)Windows用の検索ソフトPDICで1行テキスト形式に変換.この時セパレータに" : "(スペースも含む)を指定する.(作成ファイル名をdict.txtとする.)

2)linuxマシンにデータを持ってきて,以下のように実行.
(cnv2rdic.rbはrdicに付属するスクリプト)

% ruby -Ke cnv2rdic.rb dict.txt | sort -k1,1 -t: -f > dict.euc

3)各行の先頭に"■"を加える.
sed "s/^/■/" dict.euc > dict_2.euc

4)できあがったdict_2.eucをrdicで使う.
dict_2.eucを/usr/share/rdic/dict_2.eucなどにコピーしておいて,
rxvt -e rdic -p -b /usr/share/rdic/dict_2.euc
とやればrxvt上で英辞郎が使えるようになります.ウェブ上の英単語をマウスで選択するとすぐに,そのrxvt上に訳が表示されるので結構便利です.ちなみに辞書ファイルが複数ある場合にはファイル名を並べて指定すればオッケイです.rxvtとrdicはVineであればaptでサクッと入ります.

英辞郎第三版
英辞郎第三版
posted with amazlet on 07.03.28

アルク (2007/02/01)
売り上げランキング: 262

投稿者 yamada : 2007年03月27日 20:23

トラックバック

このエントリーのトラックバックURL:
http://blog2.arazio.net/mt-tb.cgi/79

コメント

コメントしてください




保存しますか?