ホーム>システム概要>無料で利用可能なツール>Namazu
Namazu
Namazu とは、ファイルの日本語全文検索ができるサーチエンジンです。
検索サイトのように、任意のキーワードを使って検索します。
操作が簡単で面倒な下準備が不要なため、気軽に導入できること、高速な検索ができることが特徴です。SPEEDEXで利用しているように、サイト内の全文検索に利用することができます。
●日本語の処理
Namazuでは高速検索を可能にするため、あらかじめインデックス(索引)を作成します。
インデックスを作るときには、「どの単語をインデックスに登録するか」が最も重要なポイントとなります。英語の場合は各単語がスペース(空白)で区切られているので、その区切りのままインデックスを作成することが可能です。
しかし、日本語の場合は単語がスペースで区切られていません。
そこで Namazu では KAKASI または Chasen(茶筌)というツールを使って、日本語を”わかち書き”にし、インデックスを生成しています。