MMR: 控制推荐多样性算法

本文探讨了推荐系统中控制多样性的MMR算法,解释了MMR如何在相关性和多样性之间取得平衡,并介绍了改进MMR的策略,包括平均距离计算和自定义相似度。此外,文章提出了对推荐系统优化的思考,强调了在精排基础上重排的重要性。
摘要由CSDN通过智能技术生成

你有考虑过推荐系统的多样性层面是怎么设计的吗?

推荐系统中精排模块是对各个item进行精准预估,而在之后的重排阶段则会整体考虑推荐的N条内容间的关系,给出listwise粒度上最优的推荐序列。

多样性是重排阶段的一个排序策略,已经有文献指出多样性和准确性并非完全矛盾。因为,用户没有点击并不一定是 ctr 预估不准确,而是用户已经点击了类似的东西,这才导致了下一条内容没有点击。所以存在多样性与精确性同时提升的空间。

MMR(Maximal Marginal Relevance)是一种简单、易于实现的多样性控制算法,非常适合快速上线,作为baseline,探索多样性对系统整体的收益空间。

MMR

MMR全称为最大边缘相关模型,同时将相关性和多样性进行衡量。因此,可以方便的调节相关性和多样性的权重来满足偏向“需要相似的内容”或者偏向“需要不同方面的内容”的要求。

MMR公式如下:

其中R是输入的列表,Di是集合R的成员,S是当前返回的结果集。Sim1(Di,Q)代表query与文档之间的相关度,推荐中一般是精排的预估ctr值。Sim2(Di,Dj)代表文档与文档之间的相似度,用来控制最终结果的多样性。

参数 λ调节相关性(相关性=精确性)和多样性之间的偏重程度,一般是通过线上真实流量探索出最优参数设定。

MMR组成最终列表是一个贪心的过程,每次选一个当前最优的文档D加入最终列表S,但不能保证是整体最优。

公式中有两层循

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值