推荐系统老司机的十条经验

最新推荐文章于 2025-03-26 22:00:25 发布

csdn_csdn__AI

最新推荐文章于 2025-03-26 22:00:25 发布

阅读量5.2k

点赞数 3

文章标签：推荐系统 Xavier-Amatriain

本文链接：https://blog.csdn.net/heyc861221/article/details/80126861

版权

本文总结了推荐系统资深专家的经验教训，强调隐式反馈的重要性，指出深刻理解数据、定义清晰的学习任务、集成多种算法以及推荐可解释性的重要性。矩阵分解和集成方法在推荐系统中发挥关键作用，而特征工程和对系统的深入理解同样不可或缺。正确的演进路径，包括从假设到AB测试的过程，是推荐系统成功的关键。最后，作者提醒不要盲目追求分布式，许多推荐算法在单机上即可高效运行。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文来源微信公众号：ResysChina，版权归原作者所有，未经作者同意，请勿转载。
原文：推荐系统老司机的十条经验
作者：陈开江@刑无刀，金融科技公司天农科技CTO，曾任新浪微博资深推荐算法工程师，考拉FM算法主管，先后负责微博反垃圾、基础数据挖掘、智能客服平台、个性化推荐等产品的后端算法研发，为考拉FM从零构建了个性化音频推荐系统。
欢迎技术投稿、约稿、给文章纠错，请发送邮件至heyc@csdn.net

一年一度的ACM Recsys会议在9月份已经胜利闭幕，留下一堆slides和tutorials等着我们去学习。

翻看今年的各种分享，其中老司机Xavier Amatriain的分享引起了我的兴趣：Lessons Learned from Building Real-Life Recommender Systems。主要分享了作为推荐系统老司机的他，多年开车后总结的禁忌和最佳实践，这样的采坑实录显然是很有价值的。

Xavier Amatriain，曾任Netflix的算法总监，现任Quora的工程副总裁。

Xavier Amatriain在recsys上的分享，是他在推荐系统领域的十条实践经验（这位老司机同样的题目在不同渠道多次分享过，一共有三个版本，加起来去重后不止十条，同学们赚到了），本文只针对他在Recsys2016上的分享一一解读。

一、隐式反馈比显式反馈要爽

所谓隐式反馈，就是用户发出这些行为时并不是为了表达兴趣/态度，只是在正常使用产品而已，反之，显式反馈就是用户在做这个操作时就是要表达自己的态度，如评分，投赞成/反对票。

Xavier Amatriain列举了隐式反馈的以下好处：

数据比显式反馈更加稠密。诚然，评分数据总体来说是很稀疏的，之前netflix的百万美元挑战赛给出的数据稀疏度大概是1.2%，毕竟评分数据是要消耗更多注意力的数据。
隐式反馈更代表用户的真实想法，比如你不是很赞成川普的观点，但是还是想经常看到他的内容（以便吐槽他），这是显式反馈无法捕捉的。而人们在Quora上投出一些赞成票也许只是为了鼓励一下作者，或者表达一些作者的同情，甚至只是因为政治正确而投，实际上对内容很难说真正感兴趣。
隐式反馈常常和模型的目标函数关联更密切，也因此通常更容易在AB测试中和测试指标挂钩。这个好理解，比如CTR预估当然关注的是点击这个隐式反馈。

举个例子，IMDB的电影排名，对比一下用票房排名和用评分排名，票房其实是一种隐式反馈的量化，表示“看过”，而评分则是显式反馈。

图片描述