倒排索引倒排表

最新推荐文章于 2023-09-15 20:13:12 发布

aishalv8524

最新推荐文章于 2023-09-15 20:13:12 发布

阅读量637

点赞数

文章标签： python

原文链接：http://www.cnblogs.com/fora/archive/2010/06/12/1756796.html

版权

为什么我们要说倒排索引呢?
    因为倒排索引是目前搜索引擎公司最对搜索引擎最常用的存储方式.也是搜索引擎的核心内容!
    在搜索引擎实际的引用之中,有时需要按照关键字的某些值查找记录,所以我们是按照关键字建立索引,这个索引我们就称之为: 倒排索引, 而带有倒排索引的文件我们又称作: 倒排索引文件 也可以叫它为: 倒排文件 来实现快速的检索与高速的效率!

那我想问下什么是倒排表呢?
     倒排文件中的次关键字索引我们称做: 倒排表
     其主要优点是: 在处理复杂的多关键字查询时，可在倒排表中先完成查询的交、并等逻辑运算，得到结果后再对记录进行存取。这样不必对每个记录随机存取，把对记录的查询转换为地址集合的运算，从而提高查找速度!

下面就是整个倒排表的建立过程(组图):

数据表

索引表

右项归并后的索引表

那我最后问下我们因该怎样建立倒排索引呢?
关于建立倒排索引其实就象我们写一本小说一样目录是章节标题对应的页码对全文搜索来讲倒排索引就是词对应文档编号!
下面我们举个例子:
案例1:
普通文档存在形式:（从文件到关键字的搜索）
      PPT (从头看起.....)==> keywords1,keywords2,keywords3,keywords4,keywords5,.............
案例2:
倒排索引翻转后的结果显示:（从关键字到文件的搜索）
      keywords1,keywords2,keywords3,keywords4,keywords5,............. (直接找关键字然后在找内容页)==> PPT

不知您看懂了没! 如果还不是很清楚我在举个例子最简单的:
       我们随便看什么书我想因该是分2种看法一种是从头到尾法! 而另一种就是先看目录看那些是我需要看的那么直接就翻到该页面! 不然和第一个人一样从头一直看看到你想要看的那不是前面时间都浪费了?? 目录就起了个关键作用! 这下因该懂了把! 如果还不清楚不要紧看看上面的倒排表你就因该懂了.

转载于:https://www.cnblogs.com/fora/archive/2010/06/12/1756796.html

aishalv8524

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
倒排索引倒排表

为什么我们要说倒排索引呢? 因为倒排索引是目前搜索引擎公司最对搜索引擎最常用的存储方式.也是搜索引擎的核心内容!在搜索引擎实际的引用之中,有时需要按照关键字的某些值查找记录,所以我们是按照关键字建立索引,这个索引我们就称之为: 倒排索引, 而带有倒排索引的文件我们又称作: 倒排索引文件也可以叫它为: 倒排文件来实现快速的检索与高速的效率!那我想问下什么是倒排表呢?...
复制链接

扫一扫

倒排索引 倒排表

倒排索引倒排表