lucene ——全文检索

在讲全文检索之前,先说下信息检索。
信息检索通俗的讲,就是从信息集合中找出与用户相关的信息,除了文本之外,还有音频、图像等。
全文检索:把用户的查询请求和全文中的每个词进行比较,不考虑查询请求与文本语义上的匹配。
[b]全文检索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。[/b]
来自[quote]http://www.lucene.com.cn/about.htm#_Toc43005313[/quote]


[img]http://dl.iteye.com/upload/attachment/473556/1b61b445-0172-3be6-93d9-3d73b2bd7edc.gif[/img]

lucene可以视为开发接口左边部分

[img]http://dl.iteye.com/upload/attachment/473558/43ae56e1-072c-3749-9cce-90060c134eee.jpg[/img]

爬虫从互联网上采集数据,经过加工分析,建立索引
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值