相关性算法--Elasticsearch相关性算法

Elasticsearch相关性算法Elasticsearch相关性算法主要分为三大部分:布尔模型,TF/IDF,向量空间模型布尔模型:and,or,not根据这些条件来匹配文档,判断搜索词是否在文档中。TF/IDF:相关性算法--TF/IDF 这篇文章里已经介绍了相关内容,计算词频的一种方法。空间向量模型:每个词的在文档的集合中都有自己的权重,比如词A的权重为2,词B的权重为5,...
摘要由CSDN通过智能技术生成

Elasticsearch相关性算法

Elasticsearch相关性算法主要分为三大部分:布尔模型,TF/IDF,向量空间模型

布尔模型:and,or,not根据这些条件来匹配文档,判断搜索词是否在文档中。

TF/IDF:相关性算法--TF/IDF 这篇文章里已经介绍了相关内容,计算词频的一种方法。

空间向量模型:每个词的在文档的集合中都有自己的权重,比如词A的权重为2,词B的权重为5,这样我们可以计作向量(2,5),他在坐标系上的图形就是远点到(2,5)点之间的连线。当我们搜索A,B的时候,有些文档中只存在A,有的文档只存在B,就可以近似的看作(2,0)和 (0,5),A和B都存在的就是(2,5)。同样通过原点和这些点的连线。比较这些线段和原点到(2,5)的线段的角度。角度越大,相关性越低,角度越低,则表示更接近模型线段,他的相关度就更高。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值