搜索引擎相关
xiawared1
这个作者很懒,什么都没留下…
展开
-
lucene索引研究
架构概览图一显示了 Lucene 的索引机制的架构。Lucene 使用各种解析器对各种不同类型的文档进行解析。比如对于 HTML 文档,HTML 解析器会做一些预处理的工作,比如过滤文档中的 HTML 标签等等。HTML 解析器的输出的是文本内容,接着 Lucene 的分词器(Analyzer)从文本内容中提取出索引项以及相关信息,比如索引项的出现频率。接着 Lucene 的分词器把这些信息写转载 2008-06-14 20:10:00 · 594 阅读 · 0 评论 -
mapreduce
http://www.pin5i.com/showtopic-21605.html 版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明http://dreamhead.blogbus.com/logs/2617482.htmlMapReduce是Google的一项重要技术,它是一个编程模型,用以进行大数据量的计算。对于大数据量的计算,通常采用原创 2009-01-04 19:21:00 · 441 阅读 · 0 评论