lucene:
lucene是apache下的一个开源的免费的全文检索工具包
他的作用L就是全文检索的作用
solr是对lucene的封装
lucene可以完成的功能,我们可以使用solr用更简单更方便的方法完成相同的功能
学习lucene的目的是为了更深层次的理解全文检索的原理,
全文检索技术
作用:
可以实现类似于百度和谷歌的搜索引擎
可以实现类似于京东,淘宝站内搜索商品的功能
可以实现类似于贴吧,论坛等站内搜索功能
智能客服
特点:
对搜索的关键词进行分词
索引库: 索引目录 所有文档
在添加文档的时候,先对文档进行分词
分的每一个词都会在索引目录中创建唯一索引
每一个词都记录了在那些文档中出现的次数
相关度排序: 根据关键词在文档中的覆盖程度,关键词在文档中出现的次数进行计算出一个权重值.权重值越大排序越靠前
一个词在很多文档中都出现了,说明这个词不重要,只关于这个词的文档都会排到最后