推荐系统系列——热门研究话题

最新推荐文章于 2022-12-26 18:45:00 发布

李霁明

最新推荐文章于 2022-12-26 18:45:00 发布

阅读量536

点赞数

分类专栏： AI 推荐系统文章标签：推荐系统热门研究菜根谭

本文链接：https://blog.csdn.net/qq_34767784/article/details/118459663

版权

AI 同时被 2 个专栏收录

13 篇文章 0 订阅

订阅专栏

推荐系统

5 篇文章 0 订阅

订阅专栏

文章目录

同步读书之《菜根谭》
- 11、志从淡泊来，节在肥甘丧
- 12、田地放宽恩泽流长
热门研究话题
6. 总结与展望
- 参考文献

同步读书之《菜根谭》

11、志从淡泊来，节在肥甘丧

藜（lí）口苋（xiàn）肠者,多冰清玉洁;
衮（gǔn）衣玉食者,甘婢膝奴颜。
盖志以澹泊明,而节从肥甘丧也。

藜口苋肠：代指粗茶淡饭。
肥甘：美味的东西。

12、田地放宽恩泽流长

面前的田地，要放得宽。使人无不平之叹；
身后的惠泽，要流的久，使人有不匮之思。

惠泽：恩泽。
匮：空，穷尽。

热门研究话题

1 数据的稀疏性

通常，用户会面临极其大量的项目可供选择。即使是最活跃的用户也只对一小组项目打分，而且大多数项目对用户的反馈也非常有限。这一稀疏性问题使得推荐系统很难了解用户的偏好。

2 冷启动

这对新用户和项目来说都是一个关键的问题。如果没有历史数据，就很难产生准确的建议。作为一种常见的解决方案，可能会向新用户推荐流行的项目，从而无法创建个性化的推荐。
而且为了解决这两个问题，不同类型的侧信息，如社交网络、用户简介和项目描述，已经被用于不同领域的推荐系统。

3 偏差

由于用户行为数据中存在各式各样的偏差，而推荐系统很依赖于用户的行为数据来进行学习和预测，所以学习出的模型准确性得不到保障[12]。所以下面本文将探讨推荐系统中常见的偏差，以期望能够更好地规避它们。
从用户、数据、模型构建的推荐系统流程示意图[12]来看，推荐系统的偏差大致有以下几种。
在这里插入图片描述
图5.1 推荐系统流程示意图

3.1 数据偏差

（1）位置偏差
用户更倾向于和位置靠前的物品进行交互，从而导致不同位置的物品被选中的概率不一致，造成数据偏差。
（2）曝光与观察偏差
带标签的训练数据都是曝光过的，而未观察到的训练数据无法确定其标签，这样就导致训练数据和推荐时实际场景的数据有偏差。
（3）选择偏差
用户倾向于给自己很喜欢或者很讨厌的两极物品打分，而对于喜恶参半的物品却不想打分，这就造成了获取的标签数据存在主观上的选择偏差而失真。
（4）一致性偏差
用户会受身边的人乃至身边的群体意识所影响而做出偏离自己意向的选择，从而导致一致性偏差。

3.2 模型偏差

（1）简化的偏差
由于实际应用场景往往很复杂，所以我们在建模时候往往会利用假设对问题进行简化，这其中就使得跟实际的情况有一定的偏差。

3.3 用户偏差

（1）流行偏差
流行的物品会被更频繁地推荐给用户，从而获得更大的流行度，以此而造成恶性循环。
（2）不公平偏差
由于数据的不平衡性，系统会对某一用户群体产生一些歧视，进而造成更加不公平的用户体验，导致恶性循环。
而且我们可以看到由于上面的反馈闭环，在已有偏差的基础上会进一步放大偏差。

4 实时性

推荐系统的实时性是指“实时”地收集和更新推荐模型的输入特征，是推荐系统总能使用最新的特征进行预测和推荐[13]。推荐系统对于实时性有较高的要求，从用户角度来看，用户期望能够在使用相关应用时更快地找到与自己感兴趣的内容。从推荐系统来看，系统更新越快，就越能代表用户最近的行为偏好特征，越容易发现最新流行的数据模式。

4.1 模型的实时性

模型的实时性是希望更快地获取全局的流行模式，发现新的趋势和相关性。相应地对于模型的更新频率有所要求，它希望模型能够尽可能实时地更新，但是有的模型会很大，更新一次耗费很大，所以推荐采用全量更新、增量更新和在线学习相结合的方式进行合理地选择模型更新的频率。

4.2 特征的实时性

模型的实时性是希望更快地获取用户的行为模式，发现用户感兴趣的物品并进行推荐。其中客户端是与用户行为最接近的环节，能够实时收集用户与物品的交互信息。对于这些信息的处理，既可以随网络请求到达服务器，也可以通过客户端缓存会话内部的行为，将其作为实时特征传给推荐服务器。

5 多样性和公平性

（1）多样性
推荐系统往往会受流行度的影响，所以如果只考虑推荐的准确性，那么就容易使用户陷入“信息茧房”，所以应该提高推荐的多样性。
（2）公平性
由于数据获取的局限于推荐的单一性，会造成推荐系统对某一群体用户的不公平性[14]。比如音乐，不同地区、不同背景、不同性格的人的喜好肯定是有所差别的，相应的推荐系统构建时应该公平地将各类人的情况考虑进去。

6. 总结与展望

本文首先回顾了推荐系统的发展历史，根据推荐系统的经典分类对各个类别推荐系统的核心思想与优缺点进行了讨论。其中基于深度神经网络的推荐系统一经发掘，便因其良好的效果而备受青睐而成为主流。最后本文还介绍了推荐系统的评价指标和目前推荐系统较为热门的研究话题。本文较为全面地阐述了推荐系统，期望能够帮助读者初步认识推荐系统的相关知识。
此外，一些先进的技术也被应用于推荐系统之上，比如说预训练技术、强化学习、联邦学习等等。而推荐系统的应用领域也在拓展，比如基于知识图谱的推荐，推荐的可解释性，基于问答系统的可交互推荐等等，可见推荐系统是一个日趋成熟但仍有很多探索可能性的研究领域。

参考文献

[12] Chen J , Dong H , Wang X , et al. Bias and Debias in Recommender System: A Survey and Future Directions[J]. 2020.
[13] 王喆. 深度学习推荐系统[M].中国工信出版社，2020：141.
[14] Beutel A , Chen J , Doshi T , et al. Fairness in Recommendation Ranking through Pairwise Comparisons[J]. ACM, 2019.

李霁明

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
推荐系统系列——热门研究话题

文章目录同步读书之《菜根谭》11、志从淡泊来，节在肥甘丧12、田地放宽恩泽流长热门研究话题1 数据的稀疏性2 冷启动3 偏差3.1 数据偏差3.2 模型偏差3.3 用户偏差4 实时性4.1 模型的实时性4.2 特征的实时性5 多样性和公平性6. 总结与展望参考文献同步读书之《菜根谭》11、志从淡泊来，节在肥甘丧藜（lí）口苋（xiàn）肠者,多冰清玉洁; 衮（gǔn）衣玉食者,甘婢膝奴颜。盖志以澹泊明,而节从肥甘丧也。藜口苋肠：代指粗茶淡饭。肥甘：美味的东西。12、田地放宽恩泽流长
复制链接

扫一扫