全文检索
jackyrongvip
这个作者很懒,什么都没留下…
展开
-
Lucene Inverted index(倒排索引)原来快速入门
Lucene是一个高性能的JAVA全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下: 设有两篇文章1和2:文章1的内容为:Tom lives in Guangzhou, I live in Guangzhou too.文章2的内容为:He once lived in Shanghai. 由于lucene是基于关键词索引和查询的,首先我们要取得这两篇文章的关键原创 2013-07-01 17:14:54 · 1172 阅读 · 0 评论 -
Xunsearch一个新的PHP可用的全文检索工具
Xunsearch一个新的PHP可用的全文检索工具,帮助一般开发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎。全文检索可以帮助您降低服务器搜索负荷、极大程度的提高搜索速度和用户体验。高性能:后端是采用 C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 500 万网页大约 1.5TB 的数据中检索时间不超过 1 秒(原创 2013-07-01 17:51:42 · 1601 阅读 · 0 评论 -
(转)sphinx安装配置手记
http://www.54chen.com/architecture/sphinx-install-and-configure-notes.html出自俄罗斯的开源全文搜索引擎软件Sphinx,单一索引最大可包含1亿条记录,在1千万条记录情况下的查询速度为0.x秒(毫秒级)。Coreseek是一款基于Sphinx的开源检索引擎,支持Tb级的全文数据索引,专门为中文用户提供免费开源的中文全文检索原创 2013-07-01 17:31:17 · 770 阅读 · 0 评论 -
(转)遭遇PHP has encountered an Access Violation
调试全文检索博客的时候突然间看到前台留言处出现了“PHP has encountered an Access Violation at 02B75679“这样的一句话,赶紧google了一下,据说http://bugs.php.net/上也能找到好几千页的关于这个问题的报告/讨论了,总结了一下,大致有这么七种会引起发生这个问题的可能性●1,是否zend所需的dll文件所在目录给的权限不够,必须有原创 2013-07-01 17:24:05 · 757 阅读 · 0 评论