倒排索引基本总结

 

1.      作用:事先建立好倒排索引表,可以加速单词查找。

2.      内容:包含单词出现的文档号、文档中的出现次数和文档中的位置(后面两个不一定有)。

3.      查询:单个词语,直接找到倒排表中的那一项。

句子查询,用这些单词在倒排表中的文档类求与运算。

4.      排序:某些特定算法。

5.      例子:三篇文章的标题分别为:

         T0=”it is what it is”    T1=”what is it”   T2=”it is a banana”

          我们能得到下面的反向索引文件:

          a{2}   banana{2}  is{0,1,2}   it{0,1,2}  what{0,1}

          如果查询”what is it” 则对应的集合是{0,1}{0,1,2}{0,1,2}={0,1}。

           当然记录的位置的话,还会有连续性约束。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值