中国科学院研究生院 课程编号:71258-Z-2
试 题 专 用 纸 课程名称:现代信息检索
任课教师:王斌
———————————————————————————————————————————————
姓名 学号 成绩
一、 判断题(正确打√,错误打X。每题2分,共30分)
1、 建立倒排索引时,只能以文件作为索引单位。 ( )0
2、 词项集合和词条集合有时可以完全不同,甚至交集为空集。( )1
3、 轮排索引和k-gram索引都可以支持通配查询的处理。 ( ) 1
4、 倒排索引的构建与所处的硬件环境息息相关。( )1
5、 γ的编码序列唯一,但解码序列不唯一。( )0
6、 向量空间模型的计算当中,采用余弦相似度和欧氏距离得到的相似度是一致的,即两个向量的余弦相似度大,则欧氏距离一定小,而当余弦相似度小时欧氏距离大。( )0
7、 信息检索系统中只存在一种索引结构。( )0
8、 隐式相关反馈中对用户的行为进行分析,因此一定会提高检索的效果。( )0
9、 在BM25检索模型中,考虑了文档长度对检索带来的影响。( )1
10、在朴素贝叶斯分类器,基于多项式模型和基于贝努利模型的实现中采用了完全相同的假设 。( )0
11、特征选择函数MI(Expected MutualInformation)考虑了词项不存在对分类带来的影响。( )1
12、SVM分类的速度与支持向量的个数无关。( )0
13、K-均值聚类算法的结果依赖于初始种子质心的选择。( )1
14、GAAC层次聚类算法的结果具有确定性。( )1
15、隐性语义索引LSI本质上是将原始的向量空间线性变换到另一个高维向量空间。( )0
二、 选择题(单项或多项选择。每题2分,共16分)
1、关于倒排索引的压缩,以下叙述正确的是( 12 )。
A)压缩能提高空间的利用率 B)压缩能提高硬盘到内存的传输速度
C)词典压缩作用不大