现代信息检索2-----布尔检索(Boolean Retrieval)

布尔检索是一种信息检索方法,利用AND, OR, NOT等操作符连接词项进行查询。例如,查询莎士比亚剧本中包含Brutus和Caesar但不包含Calpurnia的剧本。布尔检索适用于非结构化数据,但在处理大型文档集时效率较低。倒排索引是提高检索效率的一种手段,通过建立词项到包含该词项文档的列表,加速查询过程。尽管布尔检索简单且广泛应用于电子邮件和搜索引擎,但它对用户友好度不高,且无法充分利用词项频率信息进行结果排序。" 50512266,1344900,JSP中日期格式化实战指南,"['JSP开发', '日期处理', '前端展示', 'Web开发', 'Java时间库']
摘要由CSDN通过智能技术生成

下面我们进入正式的学习,希望这个系列会对自己有用,同样对你也有用!加油……

 布尔检索(Boolean Retrieval),布尔对于我们来说对比较熟悉,就是不是0就是1。顾名思义,布尔检索肯定跟0,1分不开了。剩下的我还是按照ppt顺序,娓娓道来吧。

1.信息检索:

Information Retrieval (IR) is finding material (usually documents) of an unstructured nature (usually text) that satisfies an information need from within large collections (usually stored on computers).

信息检索是从大规模非结构化数据(通常是文本)的集合(通常保存在计算机上)中找出满足用户信息需求的资料(通常是文档)的过程。

这是中英文的定义。之前在第一节也说过这个定义。现在我们就按照高中的学习方法对这个定义深究下。

关键词一--------非结构化数据。结构化数据是什么呢?即我们经常看的表格中分类好的数据。如下:

根据表中我们可以很容易的查到Salary < 60000 AND Manager 就是smith这个人。但现实是复杂的,往往我们见到的

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值