相关性搜索:利用Solr与Elasticsearch创建智能应用2

二、搜索----幕后揭秘

搜索时用户和搜索引擎之间的一种人机对话。

总所周知,搜索引擎的核心功能是存储、查询并获取内容。

鼓励用户继续进行探索的方式将相关性文档呈现给用户。

倒排索引

由词典和倒排表组成。倒排表中描述单个词和包含该词的文档列表与之对应。

词典和倒排表都是映射表。

为了让搜索引擎能够提供相关性结果并帮助用户改进查询条件,Lucene在索引中还加入了更多的数据结构和元数据。

对内容进行索引:提取、充实、分析和索引

文档的搜索和获取

布尔搜索:可以合并多条查询的返回结果,求交集算法

Lucene中BooleanQuery类,

MUST是+,MUST_NOT是-,SHOULD不加前缀

例,black +cat -dog

位置和短语匹配:确保两个单词是相邻的短语。

过滤、切面和聚合:Elasticsearch有聚合功能,允许用户基于某个字段的取值对数据进行过滤,对其他字段的取值进行分组,并最终对这些字段进行聚合处理(sum,mean,count等),以此来实现高效的在线分析处理。

排序、结果排名、以及相关性:排序规则可以通过函数进行指定。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值