现代信息检索 王斌 2012年秋季期末试题

这是一份关于现代信息检索的期末试题,涵盖倒排索引、向量空间模型、隐式相关反馈、聚类算法等多个主题。题目包括判断题、选择题、计算题和应用题,涉及信息检索系统的性能评估、压缩技术、分类器效果以及PageRank值计算等概念。
摘要由CSDN通过智能技术生成

中国科学院研究生院                 课程编号:71258-Z-2

        试 题 专 用 纸                          课程名称:现代信息检索

                                                   任课教师:王斌

———————————————————————————————————————————————

   姓名                               学号                             成绩                           

 

一、           判断题(正确打√,错误打X。每题2分,共30分)

1、   建立倒排索引时,只能以文件作为索引单位。 (   )0

2、   词项集合和词条集合有时可以完全不同,甚至交集为空集。(   )1

3、   轮排索引和k-gram索引都可以支持通配查询的处理。 (   ) 1

4、   倒排索引的构建与所处的硬件环境息息相关。(   )1

5、   γ的编码序列唯一,但解码序列不唯一。(  )0

6、   向量空间模型的计算当中,采用余弦相似度和欧氏距离得到的相似度是一致的,即两个向量的余弦相似度大,则欧氏距离一定小,而当余弦相似度小时欧氏距离大。(   )0

7、   信息检索系统中只存在一种索引结构。(  )0

8、   隐式相关反馈中对用户的行为进行分析,因此一定会提高检索的效果。(  )0

9、   在BM25检索模型中,考虑了文档长度对检索带来的影响。(   )1

10、在朴素贝叶斯分类器,基于多项式模型和基于贝努利模型的实现中采用了完全相同的假设 。(  )0

11、特征选择函数MI(Expected MutualInformation)考虑了词项不存在对分类带来的影响。(   )1

12、SVM分类的速度与支持向量的个数无关。(  )0

13、K-均值聚类算法的结果依赖于初始种子质心的选择。(   )1

14、GAAC层次聚类算法的结果具有确定性。(   )1

15、隐性语义索引LSI本质上是将原始的向量空间线性变换到另一个高维向量空间。(  )0

 

二、           选择题(单项或多项选择。每题2分,共16分)

1、关于倒排索引的压缩,以下叙述正确的是(    12  )。

A)压缩能提高空间的利用率                          B)压缩能提高硬盘到内存的传输速度

C)词典压缩作用不大                        

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值