图神经网络在快手短视频推荐中的应用
本文讲解快手在短视频推荐领域的最新论文:
CIKM'21 《Concept-Aware Denoising Graph Neural Network for Micro-Video Recommendation 》
本文将从以下几个部分对上面论文进行讲解:
一:当前短视频推荐存在的问题
二:快手新提出的短视频推荐算法讲解
三:实验结果
01 当前短视频推荐存在的问题
问题1:现存的多模态模型很难在短视频场景下提取视频内容,因为短视频的平台具有连续、大流量的特性。另一方面,短视频中所表达的丰富故事,用户的评论等将有助于理解用户对其最大的偏好;
问题2:尽管短视频平台为用户提供了“喜欢”和“评论”按钮来与之互动,大多数用户仍然只是去浏览下一个视频,而不会留下反馈信息。没有明确的用户交互,很难判断用户是否真的喜欢她/他所观看的内容,甚至还会存在许多错误点击的情况。
虽然我们可以利用观看时间来推测用户的偏好,但仍然会有许多错误的正样本,这在很大程度上会影响着推荐算法的效果;
问题3:短视频的平均生命周期非常短。在我们对短视频用户行为进行数据分析,观察到短视频在发布后两天,用户互动数量就急剧减少了。此外,大多数用户行为都是由少数网红上传的短视频造成的。
具体地说,在我们的数据集中,用户点击次数少于10次的短视频约占85%,当我们使用50作为截止阈值时,这个数字会上升到96%。
这些长尾的短视频和博主很少被推荐,推荐系统底层的反馈环路进一步加剧了这种推荐偏差,这就是所谓的马修效应。
02 快手新提出的短视频推荐算法讲解
本次快手新提出的短视频推荐算法通过实验验证表明,能在不同程度上解决上面所提出的现推荐算法所存在的问题。新算法主要分成了三个阶段:
阶段一:Warm-up Propagation
阶段二:Graph Denoising
阶段三:Preference Refinement
阶段一:Warm-up Propagation:
首先,对短视频进行概念concept提取,如下图所示,与短视频相关联的字幕