一、推荐阅读
-
paper: End-to-End User Behavior Retrieval in Click-Through Rate Prediction Model
二、模型小结
核心:SimHash(筛选topk item,降低时间复杂度) + Multi Head Attention
最近读了一篇阿里2021年发表的文章:End-to-End User Behavior Retrieval in Click-Through Rate Prediction Model,主要针对用户长期行为序列出现的问题进行解决并建模,当然也包含短期行为序列。据文章显示23%的电子商务网站用户在过去5个月内点击量超过1000次,也就是说23%用户长期行为序列长度超过1000。由于受线上inference时间的限制,很少有研究能够处理长期的用户行为序列,因此这篇文章就来研究并解决这个问题。为了达到更好的性能,首先设计一个辅助任务,从长期用户行为序列中检索topk用户感兴趣的item;然后将检索出的topk个item过一个attention网络。具体如何从用户长期行为序列中检索topk个item,文章提出了一种名为ETA(端到端目标注意)的局部敏感哈希(LSH)方法,该方法可以大大降低训练和推理成本,使具有长期用户行为序列的端到端训练成为可能。
作者针对用户长期行为序列的问题&#