[笔记]信息检索导引-第一章-布尔检索

这周刚接触 Elasticsearch 这个搜索引擎 对搜索原理稍稍感兴趣 便顺手翻了 信息检索导引 这本书,写个笔记记录下

布尔检索的基本概念:

建立文档和词项 之间的 倒序索引表 (如果把词项看成图的定点,文档看成图的边的话,就是一个关键矩阵了)

存储细节:

因为产生的倒序索引是稀疏矩阵 所以可以进行压缩以节省空间,方法一:使用链表存储词项中对应的文档信息

词项搜索结果合并:

因为词项对应的文档信息是有序的,所以

对于 and 操作的合并 就是两个有序数组的交集 or 就是并集

对于 and 操作 可以先合并结果集的在合并大的,可以提升性能


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值