文章大纲
文本检索与信息抽取系列文章:
《自然语言处理实战入门》文本检索与信息抽取 ---- 关键词抽取
信息检索
信息检索定义为对用户做出的查询进行响应并检索出最合适的信息的过程。在信息检索中,根据元数据或基于上下文的索引,进行搜索。搜索引擎 是信息检索的一个示例,对于每个用户的查询,它基于所使用的信息检索算法进行响应。信息检索算法中使用了倒排索引的索引机制。
信息检索任务的正确性由精准率和召回率来衡量。
假设 当用户发出查询时:
- 给定IR系统(Information Retrieval)返回X 文档
- 需要返回的实际或目标文档集是Y。
将召回率R 定义为系统发现目标文档的百分比(定义为正报样本与正报样本和漏报样本总和的比值)