作者:一元
公众号:炼丹笔记
背景
推荐系统(RS)已经成为大多数web应用程序的关键模块。最近,大多数RSs都是基于云到边缘框架的瀑布式的,其中推荐的结果通过在云服务器中预先计算传送到edge(例如用户移动)。尽管有效,但云服务器和边缘之间的网络带宽和延迟可能会导致系统反馈和用户感知的延迟。因此,edge上的实时计算可以帮助更精确地捕捉用户的偏好,从而提出更令人满意的建议。本文首次尝试设计和实现边缘推荐系统(EdgeRec),它实现了实时的用户感知和实时的系统反馈。此外,本文还提出了基于行为注意网络的异构用户行为序列建模和上下文感知重排序,以捕捉用户的不同兴趣并相应地调整推荐结果。在淘宝主页feeds的离线评测和在线性能测试结果表明了EdgeRec的有效性。
之前框架
如上图所示,手机端先向云端服务器初始化一个页面请求,matching和ranking模型对应页面请求生成一个排序商品集合,而这套框架有诸多问题:
- 系统反馈延迟,在相邻的两个页面请求,云端的RS无法实时调整推荐结果,所以较难满足用变化的需求。
- 用户感知延迟,RS模型部署在云端,往往会因为网络延迟导致1min种左右的延迟,很难抓住用户的实时需求。网络的带宽会进一步限制当前RS捕捉端上用户的大量的和详细的行为细节。
基于上述的情况,我们采用边缘计算来满足实时的性能要求。EdgeRec可以获得实时用户感知和实时的系统反馈。
系统
系统概览
- Client Native (CN):初始化页面请求并且将从RS服务器中返回的对应候选商品的特征进行缓存,从RS返回的商品个数被设置为100,然后CN收集用户对曝光商品的行为并且除法模型服务模块,在接收到候选商品的rank之后,CN就会调整商品的UI展示。
- Model Serving(MS):当由CN触发时,MS对从CN处接收到的用户行为和候选商品进行特征工程,然后基于神经网络的模型,其目的是通过用户行为建模来及时捕捉用户行为,并对上下文感知的Reran