贝叶斯平均:排序算法之二

贝叶斯平均思想和公式

前期讲过Wilson得分进行排序,解决了观看量很少,导致结果不可信的问题。Wilson评分虽然保证了排名的可靠性,但该排序方法也会大大削弱那种观看量少(小众的)的视频的得分,忽略了冷门视频和新事物的产生,这样排名榜上始终会是那些观看量高的视频,新视频和冷门的视频很难出来,长期靠后。

这里就有一个问题:热门视频与冷门视频的平均得分,是否真的具有可比性?举个例子来说,一个热门视频每天2000次曝光,另外一个冷门视频只有50次曝光。很明显,使用Wilson评分,后者的得分将被大幅拉低,所以考虑到贝叶斯平均进行排序,给每个视频增加一定量的曝光。

其思想在于:

  1. 假设所有视频都至少有m次曝光(设置一个基准),那么就都具备了同等的一个评选条件;
  2. 然后假设这m次曝光的评分是所有视频的平均得分(即假设这个视频具有平均水准);
  3. 最后,用现有的评分进行修正,长期来看,v/(v+m)这部分的权重将越来越大,得分将慢慢接近真实情况。

贝叶斯平均式子如下:

在这里插入图片描述
v : 代表该视频的实际观看量;
m : 代表最低的一个观看量(人工干预设置,可根据实际观看情况

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值