書き屋のための変換辞書 for ATOK |
||||
|
|
10万語地名辞書ATOKは実によくできた日本語IMEですが、こと地名に関しては多少の不満があります。 ATOKのシステム辞書には、市区名に続く一部の地名、町村名に続く多くの地名、字名などが登録されていないため、必要に応じてユーザーが登録しなければなりません。 システム辞書に登録されていない約10万語の地名を中心に、河川名や湖沼名なども含め一つの辞書にまとめてみました(河川・湖沼名については単独の辞書としても公開しています)。
山岳名辞書固有地名の収録語数などは、各日本語IMEに共通する弱点です。国内の山岳名約11000を辞書にしてみました。 統一地名辞書新聞・出版関係では、地名の表記にもルールがあります。 小文字の「ヶ」や「ッ」は使わず(=標準表記、例:霞ヶ関)、 大文字の「ケ」や「ツ」を使います(=統一表記、例:霞ケ関)。 この辞書は地名の「統一表記」を狙いとしたもので、標準表記の地名を削除するためのテキストデータも用意しました。 (かんぴょう辞書 には「統一地名」が既に登録されています。 同辞書を使用される環境では、下の「標準地名削除用テキストデータ」のみお使いください)
標準地名削除用テキストデータ 統一地名の辞書をインストールしても、標準地名が候補語として出てくるのは、わずらわしいものです。
ATOKでは「辞書の引き算」ができるため、削除用のテキストデータがあれば、不要語は変換候補から外すことが可能です。
辞書ユーティリティの単語コメント一括処理で、ダウンロードした「標準地名削除用テキストデータ」を単語ファイルに指定して削除すれば、
地名については必要最小限の候補語に絞り込めることになります。
その他の辞書
|
|||