长尾预测效果不好怎么办？试试这两种思路

最新推荐文章于 2023-09-11 12:21:13 发布

fareise

最新推荐文章于 2023-09-11 12:21:13 发布

阅读量462

点赞数

文章标签：机器学习深度学习聚类

本文链接：https://blog.csdn.net/fareise/article/details/126715260

版权

长尾问题在推荐系统中是个挑战，本文探讨了两种解决方案：基于meta-learning和图学习。meta-learning通过学习快速适应小样本任务的能力，如在冷启动广告和用户偏好估计中应用。图学习则利用实体间的关系来补充长尾实体的表示，如在新广告的embedding生成和点击率预测中采用。这两种方法旨在改善模型在长尾样本上的预测效果。

摘要由CSDN通过智能技术生成

微信公众号“ 圆圆的算法笔记”，持续更新NLP、CV、搜推广干货笔记和业内前沿工作解读~
后台回复“ 交流”加入“ 圆圆的算法笔记”交流群；回复“ 时间序列“、”多模态“、”迁移学习“、”NLP“、”图学习“、”表示学习“、”元学习“等获取各个领域干货算法笔记~

推荐阅读历史相关文章：

Meta-learning核心思想及近年顶会3个优化方向

推荐系统大杀器——基于图学习的协同过滤

1.什么是长尾问题

长尾问题一直是很多场景中最难优化的问题，特别是在推荐系统领域，长尾问题十分常见，却很难优化。在推荐系统中，长尾问题指的是，某些实体在训练数据中出现次数非常少，导致模型对这部分样本打分效果很差。典型的场景包括，新用户没有几条浏览行为，如何准确推荐用户感兴趣的内容；一些商品非常小众，用户反馈很少，如何对这些商品进行推荐等等。长尾在一个成熟的系统中往往服从二八定律，即20%的头部实体贡献了80%的数据，而剩余80%的实体只有20%的数据，实际场景中甚至比二八还要长尾。

长尾问题的难点主要体现在以下2点。首先，长尾实体的样本量太少，模型很难学习这部分样本的规律，例如用户的embedding、商品的embedding等，都是需要大量数据学习的。其次，头部样本在数量上占绝对优势，导致模型偏向拟合头部样本的规律，而尾部样本的规律和头部样本可能有较大差异，导致模型在尾部样本效果不好。

2.如何解决长尾问题

那么，如何解决长尾问题呢？业内工作主要包括两种核心优化方法。第一种方法是基于meta-learning解决长尾问题。刚才我们说到，长尾用户或商品的数据量少，模型难学习，那么我们就让模型具备在少量样本上能学的比较好的能力就可以了。而meta-learning正是让模型实现上述能力的方法。我在之前的文章