信息检索(IR)—评价指标(一)

最新推荐文章于 2025-03-22 10:41:45 发布

隔壁的NLP小哥

最新推荐文章于 2025-03-22 10:41:45 发布

阅读量4.1k

点赞数 2

分类专栏：信息检索

本文链接：https://blog.csdn.net/hei653779919/article/details/105927960

版权

信息检索专栏收录该内容

7 篇文章

订阅专栏

信息检索(IR)—评价指标(一)

1. 信息检索基本介绍

1.1. 信息检索任务

1.1.1 任务描述

信息检索是指在给定自然语言的文档(或者图片，视频等多媒体)集合和用户的查询(query)的条件，通过系统的处理，返回与query相关的经过排序的文档(或者多媒体)的文档子集。

1.1.2 query的基本形式

根据上述的概念描述，我们可以知道query的基本形式可以包括关键词，带有布尔操作的关键词，自由文本，示例文档，图片，视频等等。

1.1.3 基本分类

列表式检索：例如百度，Google等检索。
推荐式检索：例如购物网站中检索某个关键词之后返回的具有推荐含义的检索过程。
对话式检索：与机器进行多轮对话式的检索。

1.2 信息检索系统的基本结构

在这里插入图片描述

1.3 目前搜索引擎的基本框架

在这里插入图片描述

2. 信息检索的评价

2.1. 评价内容

相关性
返回的文档中包含了多少相关文档。
所有的相关文档中返回了多少。
返回文档中的位置问题。
检索速度
时空开销
响应速度
规模
覆盖率
访问量
新鲜度
数据更新的速度。

2.2. 评价的前提条件

具备一个文档集合C。检索系统从该集合中按照查询要求检索出相关文档。
一组用户查询{ $q_1,q_2,...,q_n$ }。每一个查询要求 $q_i$ 描述了用户检索的信息需求。
对应于每一个用户的查询要求的标准相关文档集{ $R_1,R_2,...,Rn$ }，相关文档集作为标准答案集合，一般由人工进行构造。
一组评价指标，这些指标反映了系统的检索性能。
相同的文档集合，相同的查询主题集合，相同的评价指标，不同的检索系统进行比较。

2.3. 相关性理论和 “pooling”方法

在介绍着部分内容之前，我们先来分析一下，在上述中提到了，对于一个 $q_i$ ，由人工构建出相关文档集合。但是，随着数据量的不断增加，相关文档的集合的规模可能成千上万的进行计数，换句话来将，人工构建的相关文档集合的规模远远跟不上数据增长的规模，那么是否有一种方法能够自动的去构建相关文档集合呢？下面，我们来来介绍相关性理论和“pool”方法。

2.3.1. 相关性理论

在相关性理论中，对于一个用户查询和一个给定的文档集合，存在并且只存在一个和该查询相关的文档集合。检索系统的目标就在于检出相关文档而排出不相干文档。

2.3.2 “pooling”方法

两个假设：

假设绝大多数的相关文档都收录在这个文档池中。
没有进行判断的文档即被认为是不相干的。

具体操作：

针对某一个检索问题，所有参与其检索试验的系统分别给出各自检索结果中的前K个文档(例如K=100)。将这些结果文档集合汇集起来，就得到了一个可能相关文档的文档池(“pool”)。最后对于这些结果文档进行去重，在由主题的构建者评判出每一个文档的相关性。

2.4 准召率和F值

2.4.1 文档划分和混淆矩阵

在介绍部分内容之前，我们先来分析，对于一个query，在所有的文档集合中能够检索出来的情况有哪些？首先，整个文档集合可以别划分成检索出来的文档和没有被检索出来的文档。对于检索出来的文档，可以划分成相关的和不相干的文档，对于没有被检索出来的文档，可以分成相关的文档和不相关的文档。我们用一张图来描述一下这种结果。

在这里插入图片描述