信息检索——倒排索引和布尔查询

本文介绍了信息检索中的倒排索引和布尔查询技术。倒排索引通过词项-文档关联优化了搜索效率,解决了线性扫描的缺点。布尔查询允许使用AND, OR, NOT等操作符组合查询条件,提供了更高的灵活性。同时,文章讨论了查询优化策略,如按文档频率排序查询词,以减少处理工作量。" 112325568,10536386,Python爬虫:14行代码轻松爬取微信小程序视频,"['Python开发', '网络爬虫', '数据抓取', '文件下载']
摘要由CSDN通过智能技术生成

 

  1. 线性扫描
  2. 词项-文档关联
  3. 倒排索引
  4. 查询处理AND
  5. 布尔查询
  6. 自由文本查询
  7. 查询优化

 

 

举例:查找《莎士比亚》中的人名

1 AND 2 but NOT 3

 

线性扫描grepping:

从头到尾阅读该全集,对每部剧本都留心是否包含1和2不包含3

缺点:

太慢

不灵活

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

NoTqqa

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值