信息检索

1. 信息检索(Information retrieval)基本原理:
 提问标识(检索式)与 文献标识的对比.
2. 信息检索常用方法:
 (一)布尔逻辑:
  逻辑或(+,OR):
  逻辑与(*,AND):
  逻辑非(-,NOT):
 (二)向量空间模型:
 (三)概率模型:

3. 截词搜索: 又称干搜索,模糊检索.
  -检索系统不同,截词符也不同,常用的截词符有: #,?,* 
  -氛围有限截词(即一个截词符只代表一个字符)和无限截词(一个截词符可代表多个字符).
  -按截断的位置来分,截词可分为后截断,前截断,中截断三种类型。
  后截断: comput*
  前截断: *computer
  中截断: *comput*
4. 限制检索: (即搜索条件).
5. 信息检索最重要的两个指标:
  " 检全率 "与 " 检准率 "
6. 布尔检索的优缺点:
   优点:
  (1).简单,速度快
  (2).查询表达式易于掌握.
   缺点:
  (1). 不够精确,不能反映不同 "项目" 对一个文档的重要程度的差异.
  (2). 检索结果地位平等,无法排序.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值