bm25 算法

BM25算法是一种用于计算查询文本与文档相关度的模型,它基于词项出现的概率和文档长度进行加权。文章介绍了BM25的基本公式,包括F4、L(i,j)的定义,并讨论了两种常见的公式变种。参数b和k1的选择对结果有一定影响,通常设置为b=0.5,k1=2。BM25可以视为TF-IDF的扩展形式。" 112543351,10539270,国际数学竞赛:三角形面积计算公式详解,"['数学竞赛', '几何', '公式应用', '教育', 'C#编程']
摘要由CSDN通过智能技术生成

推荐阅读:

http://www.minerazzi.com/tutorials/okapi-bm25-model.pdf

http://www.minerazzi.com/tutorials/probabilistic-model-tutorial.pdf

http://www.staff.city.ac.uk/~sb317/papers/foundations_bm25_review.pdf

http://www.tao-sou.com/744.html

https://nlp.stanford.edu/IR-book/html/htmledition/okapi-bm25-a-non-binary-model-1.html


bm25算法全名是Best Match 25,在BM系列中还有其他公式,它一般用作计算当前查询的输入文本与文档的相关度。BM25的一般公式如下:


这篇文章的公式都是取自于推荐阅读里面的论文,本文只是简单翻译一下,公式的符号比较多,看下去的朋友需要耐心。各个符号的定义如下:

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值