算法
文章平均质量分 91
申涛
无他,唯勤思考而已!
展开
-
BM25算法详解
BM25算法通过加入文档权值和查询权值,拓展了二元独立模型的得分函数。这种拓展是基于概率论和实验验证的,并不是一个正式的模型。BM25模型在二元独立模型的基础上,考虑了单词在查询中的权值以及单词在文档中的权值,拟合综合上述考虑的公式,并通过实验引入经验参数。 公式如下:原创 2016-02-17 20:21:48 · 32495 阅读 · 1 评论 -
随机性偏差模型(DFR)介绍
前言第一次翻译文章,可能多多错误,但是希望可以对原文阅读起到帮助。随机性偏差模型 (DFR) 是信息检索的最早模型之一,哈特的 2-泊松索引-模型 [1] 的最早模式之一。2-泊松模型基于在一系列的具有价值的文档所提供的词语,这些词语在相关文档中发生的概率比在不相关文档中发生的概率更高。 另一方面,有一些词语不包含于关键的文档,所以他们的频率遵循随机分布,是单一的泊松模型。哈特的模型中,首先作为检翻译 2016-09-26 08:46:04 · 5627 阅读 · 0 评论