技术
文章平均质量分 77
Trantor
这个作者很懒,什么都没留下…
展开
-
Lucene倒排索引原理
Lucene倒排索引原理(转) Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下: 0)设有两篇文章1和2 文章1的内容为:Tom lives in Guangzhou,I live in Guangzhou too. 文章2的内容为:He once lived in Shanghai. 1)由于lucene是基于关键词索引和查询的,转载 2007-03-03 18:24:00 · 869 阅读 · 0 评论 -
vector的增长机制
假设我们希望从一个文件中将一串类型为double的值读进一个数据结构中,从而允许我们高效地访问这些值,通常的方法如下: vector values; double x; while (cin >> x) values.push_back(x); 当循环结束时,values会容纳有所有的值,我们将可以通过values高效地访问任何值。 在直觉上,标准库vector类原创 2007-03-03 18:26:00 · 1364 阅读 · 0 评论 -
搜索结果排序
乱世用重典,搜索引擎在与spam的长期战争中总是处于不利地位(这很容易理解,搜索引擎公司真正考虑搜索结果相关性和排序的只有几个人,而互联网上整天琢磨怎么对付搜索引擎的有几万几十万webmaster),所以对spam的惩罚很严厉,事实上,所有的搜索引擎对它们认定的spam行为,通常只有一种惩罚:永久屏蔽。现在流行的太极链、凤凰链这些超链群,就存在被当做spam的可能性。国内的搜索引擎注册还没有形成市原创 2007-03-03 18:28:00 · 1081 阅读 · 0 评论