搜索已经火了好久了,今天简单了解了一下关于搜索相关的东西。
外面有不少成熟的搜索引擎:Lucene、Xapian和Sphinx等。
Lucene是Java的标准搜索引擎,也是Apache的顶级项目之一,相关介绍:http://www.ibm.com/developerworks/cn/java/j-lo-lucene1/#N1005E,车东的介绍:http://www.chedong.com/tech/lucene.html。它的官网:http://lucene.apache.org/。
它也有Python的库,PyLucene,相关试用手记:http://www.cnblogs.com/unfish/archive/2006/10/25/539956.html。貌似安装和使用上有一些细节,这个等试用后再补充进来。
Xapin是C++开发的,官网:http://www.xapian.org/。
关于Xapian和Sphinx的测试比较文章:http://www.letrails.cn/archives/xapian-vs-sphinx-in-rails