推荐系统遇上深度学习(一四一)-[快手]移动端实时短视频推荐-CSDN博客

本文链接：https://blog.csdn.net/abcdefg90876/article/details/128439491

这篇博客分享了快手团队在CIKM2022的应用研究最佳论文，探讨移动端实时短视频推荐。针对传统推荐系统在敏感性和准确性上的挑战，提出在移动端部署轻量级模型以实现端上实时推荐。系统架构包括服务端推荐、模型训练和客户端推荐，重点介绍了端上排序模型的设计理念、输入特征、特征工程、模型结构和训练。此外，还提出了上下文感知的重排序方法，通过自适应步长的Beam-Search优化视频展示顺序。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

今天给大家带来CIKM2022应用研究方向最佳论文-来自于快手团队的《Real-time Short Video Recommendation on Mobile Devices》，主要研究在移动端如何做到更好的短视频实时推荐，是一篇不错的落地经验分享的论文，一起来看一下。

1、背景

近几年来短视频平台逐渐发展，像快手、抖音等平台吸引了大批用户的使用。下图为典型的短视频应用的页面截图。由于短视频时长较短，内容主题丰富多样，用户通常会在很短时间内观看许多不同主题的短视频，同时用户的实时兴趣可能会不断发生变化。因此，对于短视频应用来说，其推荐系统如何针对用户的实时反馈做出更敏感准确的推荐，是十分重要的。

传统的推荐系统通常部署在服务端，并包含多个阶段：召回，精排和重排阶段。客户端向推荐系统发送用户分页请求，然后推荐系统一次性返回一整个页面的内容，随后客户端将这些结果一个接一个展现给用户。对于这样的架构，主要存在两方面的问题：

1）敏感性：服务端只有在接收客户端发起的分页请求时才有机会调整推荐内容，无法基于用户的实时反馈作出实时的内容决策；
2）准确性：用户的实时反馈信息无法被及时利用。只有当这些用户反馈信息可用后，才会回传给服务端，这会花费数十秒甚至几分钟的时间，这对特征的实效性影响很大。同时，客户端特有的特征（用户的网络情况等），在服务端是无法获取到的，但对于实时用户兴趣预测来讲，这些特征也十分重要。

随着算力和存储能力发展，使得在一些移动端的的设备如手机、平板部署甚至训练简单的DNN模型变为可能。通过在移动端部署轻量级的模型，提供实时的推荐排序能力，来解决上述两方面的问题，为用户提供更为实时准确的推荐结果。

本文重点针对短视频场景下的端上实时推荐，重点分享两方面的经验：一方面如何有效利用端上的用户实时反馈特征进行模型预估；另一方面是如何通过自适应确定搜索步数的 beam search 来对短视频进行重排，生成整体效果更好的排序。接下来，对快手整个