搜索
文章平均质量分 53
okwangxing
学习中
展开
-
Lucene之Helloworld
[b]Lucene[/b]不是一个完整搜索引擎,不具备爬虫功能,管理界面之类的功能,可其部分之项目中实现了网站的搜索引擎,[b][url=http://lucene.apache.org/nutch/]Nutch[/url][/b]就是其中的一个,基于Lucene实现的搜索引擎应用. . 本文记录下自己的学习点点滴滴,实现一个简单的程序, [b]Hello world 之实现文本搜索[/...原创 2010-02-24 17:22:43 · 77 阅读 · 0 评论 -
Lucene之索引建立
[b]Lucene[/b]可对email,网页,文本资料,doc,pdf之类的文档进行索引建立,在建立索引的时候可为以后的排序做些处理.但运行到分布式的环境中,需要考虑建立索引的性能问题,并发问题,多线程问题,死锁问题,一个Document中包含多个Field. [color=blue]Index的建立大致步骤:[/color] [color=gray]1.源数据文本化[/color]...原创 2010-02-25 02:25:09 · 93 阅读 · 0 评论 -
Lucene中Boost对文档权重的影响
[b]前提[/b]:不对结果做sort操作. 在搜索中,并不是所有的Document和Fields都是平等的.有些技术会要求到对其Doucment或者Fields的权值改变,[b]默认值为:1.0F[b],以上需求都是通过改变Document的boost因子来改变的. [code="java"]setBoost(float)[/code] [code="java"] @Test p...原创 2010-02-26 00:11:45 · 249 阅读 · 0 评论