今天给大家带来CIKM2022应用研究方向最佳论文-来自于快手团队的《Real-time Short Video Recommendation on Mobile Devices》,主要研究在移动端如何做到更好的短视频实时推荐,是一篇不错的落地经验分享的论文,一起来看一下。
1、背景
近几年来短视频平台逐渐发展,像快手、抖音等平台吸引了大批用户的使用。下图为典型的短视频应用的页面截图。由于短视频时长较短,内容主题丰富多样,用户通常会在很短时间内观看许多不同主题的短视频,同时用户的实时兴趣可能会不断发生变化。因此,对于短视频应用来说,其推荐系统如何针对用户的实时反馈做出更敏感准确的推荐,是十分重要的。
传统的推荐系统通常部署在服务端,并包含多个阶段:召回,精排和重排阶段。客户端向推荐系统发送用户分页请求,然后推荐系统一次性返回一整个页面的内容,随后客户端将这些结果一个接一个展现给用户。对于这样的架构,主要存在两方面的问题:
1)敏感性:服务端只有在接收客户端发起的分页请求时才有机会调整推荐内容,无法基于用户的实时反馈作出实时的内容决策;
2)准确性:用户的实时反馈信息无法被及时利用。只有当这些用户反馈信息可用后,才会回传给服务端,这会花费数十秒甚至几分钟的时间,这对特征的实效性影响很大。同时,客户端特有的特征(用户的网络情况等),在服务端是无法获取到的,但对于实时用户兴趣预测来讲,这些特征也十分重要。
随着算力和存储能力发展,使得在一些移动端的的设备如手机、平板部署甚至训练简单的DNN模型变为可能。通过在移动端部署轻量级的模型,提供实时的推荐排序能力,来解决上述两方面的问题,为用户提供更为实时准确的推荐结果。
本文重点针对短视频场景下的端上实时推荐,重点分享两方面的经验:一方面如何有效利用端上的用户实时反馈特征进行模型预估;另一方面是如何通过自适应确定搜索步数的 beam search 来对短视频进行重排,生成整体效果更好的排序。接下来,对快手整个