ELK学习总结(1-3)倒排索引

1、倒排索引(反向索引)

     一种索引方法,用来存储在全文检索下某个单词在一个/组文档中的存储位置。

     常规索引,文档->关键词,费时,得把一个文档全部遍历一遍

     倒排索引,关键词->文档,全文搜索过程如下:

     1、构建单词集合:

                先对文档进行分词,

                然后筛选过滤,

                得到单词集合,并编号id

                

           2、构建文档集合:文档id

 

           3、建立单词、文档矩阵, 得出倒排索引,如:

                乔布斯:{(文档1,<位置3,位置11>),2次}, {(文档2,<位置7>),1},{(文档3,<位置9>),1}

                苹果:{(文档1,<位置16>),1次},  {(文档5,<1>),1次}  

 

 

 

      

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值