现代信息检索在我的定位中就是一个旁听课,但我还是选了,毕竟是水课,而且两学分。
下面进行一下总结。
课程主要分为一下部分:
主要问题:给定查询如何给出相应的文档?
1.排序,根据相关度进行排序
2.倒排记录表(词条,词类,词项)
3.容错式检索(编辑距离和词典)
4.索引构建(BSBI,SPIMI)BSBI(基于磁盘的外部排序构建索引)和SPIMI(内存单遍扫描构建索引)算法
5.压缩(词典压缩,词项压缩)
现代信息检索在我的定位中就是一个旁听课,但我还是选了,毕竟是水课,而且两学分。
下面进行一下总结。
课程主要分为一下部分:
主要问题:给定查询如何给出相应的文档?
1.排序,根据相关度进行排序
2.倒排记录表(词条,词类,词项)
3.容错式检索(编辑距离和词典)
4.索引构建(BSBI,SPIMI)BSBI(基于磁盘的外部排序构建索引)和SPIMI(内存单遍扫描构建索引)算法
5.压缩(词典压缩,词项压缩)