【自然语言处理】补充:布尔模型

【自然语言处理】补充:布尔模型

布尔检索是指针对查询的检索,布尔查询是指利用AND,OR或者NOT操作符将词项连接起来的查询,例如:信息AND检索、信息OR检索、信息AND检索AND NOT教材

  • Google的高级搜索/布尔查询
    • Google的AND—百度 “ 手机 报价 ”
    • Google的NOT—百度 “ 手机 - 报价 ”
    • Google的OR—百度 “ 手机 | 报价 ”

示例:莎士比亚的哪部剧本包含Brutus及Caesar但是不包含Calpurnia?布尔表达式为Brutus AND Caesar AND NOT Calpurnia。

  • 一般方法:

    • 从头到尾扫描所有剧本,对每部剧本判断它是否包含Brutus和Caesar,同时又不包含Calpurnia
    • 缺点:速度慢(特别是大型文档集);处理NOT Calpurnia并不容易(一旦包含即可停止判断);不太容易支持其它操作(eg,find the word Romans near countrymen);不支持检索结果的排序(即只返回较好的结果)
  • 词项-文档(term-doc)的关联矩阵
    在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值