全文検索エンジンの履歴

Namazu


簡単お手軽に使える検索エンジン。未だに改良され続けている。

昔は検索エンジンの定番でしたな

今はFLOSSの検索エンジンの実装もだいぶ増えたので(でもLuceneとかXapianとか優れた設計のインデクサは2000年頃には既に出てましたが)、あえてNamazuを選ぶ理由はあまり見当たらなくなりましたけどね。とはいえ、

> インデクサーのmknmzにファイルサイズのチェック機構を追加し、UTF-8の処理とZIP処理を2つの拡張機能モジュールに整理統合している。

ただ枯れているだけのソフトウェアではなくて地道に改良は加えられていますね。

http://slashdot.jp/it/article.pl?sid=09/03/22/1257210

Hyper Estraier と Tokyo Dystopia の違い


作者は同じ人(平林 幹雄さん、mixiの中の人)。

HEは簡単に使えてお手軽。
TDは業務用中の業務用C言語からしか使えないっぽい。

しかし、TDは違います。エンドユーザ向けではなく、完全にプログラマ向けのパッケージになっています。ツンデレどころか、ツンツンです。言語バインディングはないしフィルタもないしUNIX版しかないしマニュアルもそっけないし英語だし…といった具合です。TDの製品コンセプトは、「数年以上の実務経験のあるCプログラマが、mixiのような膨大なデータ量と尋常でないトラフィックに耐える各種の検索システムを、実サービスの要件を満たす最適化を施しながら、コードの8割程度を再利用して実装できる」ことです。

http://alpha.mixi.co.jp/blog/?p=179