倒排索引

倒排索引简介:
倒排索引是一种索引方法,常被用于全文检索系统中的一种单词文档映射结构。现代搜索引擎绝大多数的索引都是基于倒排索引来进行构建的,这源于在实际应用当中,用户在使用搜索引擎查找信息时往往只输入信息中的某个属性关键字,如一些用户不记得歌名,会输入歌词来查找歌名;输入某个节目内容片段来查找该节目等等。

倒排索引又叫反向索引,它是一种逆向思维运算,是现代信息检索领域里面最有效的一种索引结构。

倒排索引的核心关键就在于索引结构:词映射到文件名,就像一首歌,当你写在收索框内输入这首歌的歌词,那么,倒排索引就会找到对应的歌名,这就是倒排索引。

这里面也有一个过程:当我输入歌词时,在检索的后台数据库中进行比对,对检索的结果形成一个队列,然后对这个队列进行排序,这其间有个位运算,从而得到一个结果返回给用户。

技术剖析:Doc2term词构造、倒排记录表的构造

1.term词构造

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值