搜索引擎——反向索引原理揭秘及手写ik分词器

原创不易,转载请标明地址,或者直接附上我的博客首页https://georgedage.blog.csdn.net/

上篇博客我们说到,数据库为什么不适合搜索引擎的底层存储?,那么什么适合呢?

elasticsearch / solr

那么为什么搜索引擎适合呢?搜索引擎有什么优点呢?下面我们根据提出问题,由浅及深的进行探讨!!!


一、首先分析问题

我们查询时,输入的是苍老师,想要得到标题或内容中包含“苍老师”的新闻列表。怎么办?

有同学会提出,如果标题、内容列上都有一个这样的索引,里面能快速找到与苍老师关键字对应的文章id,再根据文章id就可以快速找到文章了。


二、那么你认为这个索引是什么样的结构呢

在这里,词到文章的索引,我们就称之为倒排索引!!! 也就是搜索引擎的精髓所在。


三、为什么称它为倒排索引?

其实说个秘密,哈哈,也不算秘密,倒排索引英文全名:Inverted Index,然后被国人翻译失败了,翻译成倒排索引,其实它真正的名字应该是反向索引。

那么反向索引还是索引吗?,从这个词上,你或许就能猜到。反向索引

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值