DPP多样性

最新推荐文章于 2022-11-24 20:13:27 发布

crazy_gai

最新推荐文章于 2022-11-24 20:13:27 发布

阅读量2.4k

点赞数 2

分类专栏：算法文章标签：推荐系统多样性 DPP 算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gaijianwei/article/details/109499736

版权

一、推荐系统目标

推荐系统的目标主要包含两个方面：Exploitation 和 Exploration 。

在 Exploitation 中最重要的是 Relevance ( 相关性 ) 的计算，其根本思想是根据用户浏览、观看和收藏的内容等用户行为数据推测该用户可能采取的行动。常见的推荐算法大多是基于针对该目标的优化而展开的。

然而用户行为数据在现实中很可能过少、不足以全面地体现用户的兴趣。这一现象在冷启动等场景中很常见。此时推荐系统还有责任挖掘用户尚未表现出的兴趣，并且避免由于现有行为数据过少而导致推送内容相似性过高的情况。这就需要引入 Exploration 。

Exploration 主要有三个方面：

1. 覆盖度：被推荐给用户的内容占全部内容的比例应该较高，特别是新的内容能够有机会展现给用户。

2. 惊喜：推荐的内容并不与用户之前的行为明显相关，但又是用户所喜欢的。这能很大程度提升用户体验，但却难以给出衡量指标。

3. 多样性：在短时间内不要过多地向同一用户推荐同一类型的内容，而是混合各种类型的内容推荐给用户。衡量这一指标主要通过三个方面，接下来将逐一介绍。

二、如何衡量推荐内容的多样性？

2.1、Temporal Diversity ( 时间的多样性 )

推荐结果应随着时间的迁移发生改变，其衡量的指标是在固定的时间间隔内推荐不同类的内容的个数。比如一个推荐系统在一段时间内给用户推荐了10个内容，那么这10个内容中属于不同类别的个数，即可衡量推荐系统的多样性。

对于这个指标的提升主要有三个方式来提升这个指标：

第一个类似于 Item-based CF 的思想，预先根据所有用户的历史偏好数据计算内容之间的相似性，然后推荐与该用户的喜好相类似的内容。

第二个是针对用户的行为做一个时间上的衰减，这样能够针对老用户增大他观看新类型结果的变化。

第三个是 Impression discount ( 印象折扣 ) ，统计所有推荐给用户的内容中哪些是用户没有观看的类型，降低该类型的曝光度，从而给其他类型的内容增加更多的曝光机会。

2.2、Spatial Diversity ( 空间的多样性 )

它的衡量指标是单个推荐列表中物品之间的差异程度，可以通过计算在同一个推荐 list 中两两 Item 之间的相似度的平均值来进行衡量。

接下来我们将详细介绍该方面内容：

首先我们为什么关注这样一个指标呢？这是因为在推荐系统中我们只关注准确性指标的话，那么会导致推荐出来的内容大部分都相似。

在上面这幅图中，每一个点代表一个 Item ，横坐标表示物品之间的相似性，横坐标越近表示物品的相似性越高，纵坐标表示推荐系统对 Item 的打分。

在左图中有个用户观看了一个 Item 用红点表示，那么推荐系统会根据这个行为推荐10内容给用户，那么这10个内容和这个 Item 相似度非常高。

在右图这个例子中，一个用户观看

最低0.47元/天解锁文章

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
DPP多样性

一、推荐系统目标推荐系统的目标主要包含两个方面：Exploitation和Exploration 。在Exploitation中最重要的是Relevance( 相关性 ) 的计算，其根本思想是根据用户浏览、观看和收藏的内容等用户行为数据推测该用户可能采取的行动。常见的推荐算法大多是基于针对该目标的优化而展开的。然而用户行为数据在现实中很可能过少、不足以全面地体现用户的兴趣。这一现象在冷启动等场景中很常见。此时推荐系统还有责任挖掘用户尚未表现出的兴趣，并且避免由于现有行为数据...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。