【信息检索导论】第七章搜索系统中的评分计算
1. 总述本章主要解决以下问题:对于千亿级别的文档,为每一个询问对文档库进行排序是不现实的,如果快速的检索出某个询问最相关的topk个文档呢?除了query与document的相似度之外,对文档进行排序的过程是否还需要其他指标? 如何综合这些指标呢一个完整的信息检索系统需要包括哪些模块?向量空间模型是否支持通配符查询?2. 快速评分与排序本章主要介绍一些启发式的方法,用来快速的找到符合与某个询问较为相关的K个文档,找到的文档中并非完全包含最相关topk,但我们会返回与真实topk分数接近的