【AI知识点】倒排索引（Inverted Index）

AI完全体

已于 2024-10-15 09:45:43 修改

阅读量1.5k

点赞数 16

分类专栏： AI知识点文章标签：索引数据结构搜索引擎文档检索系统全文搜索数据库数据库信息检索

于 2024-10-04 23:41:39 首次发布

本文链接：https://blog.csdn.net/weixin_43221845/article/details/142708711

版权

【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】

倒排索引（Inverted Index） 是信息检索系统中用于快速查找包含某个词项的文档集合的核心数据结构。倒排索引在搜索引擎、全文检索系统以及数据库中被广泛使用，它能够极大提高查询速度，尤其是在处理大规模文本时。

1. 倒排索引的基本概念

倒排索引是一种数据结构，用于将词项（terms）映射到包含这些词项的文档集合。它的基本思路是将文档中的每个词项作为索引关键字，并记录所有包含该词项的文档编号（或其他标识）。这样，当我们需要查找某个词项时，直接通过倒排索引可以找到与该词项相关的文档，而不必逐一扫描所有文档。

倒排索引由两部分组成：

例如，假设我们有三个文档如下：

生成的倒排索引可能如下：