论文题目: Search-based User Interest Modeling with Lifelong Sequential Behavior Data for Click-Through Rate Prediction
论文地址: https://dl.acm.org/doi/10.1145/3340531.3412744
论文发表于: CIKM 2020
论文大体内容:
本文主要提出了SIM(Search-based Interest Model)模型,用于支持超长用户行为序列建模,从而使得模型取得更好的效果。
Motivation:
用户行为序列的使用对模型效果的提升有很大的帮助,比如当前SOTA的MIMN模型依靠最长1000的用户行为序列,取得很好的效果。而能否使用更长的用户行为序列来获取更大的收益呢,这正是本文需要探索的。
Contribution:
①提出SIM模型去建模用户长行为序列;
②SIM模型应用于线上取得明显收益;
③用户行为序列长度最长能达到54k,是SOTA方法(MIMN)的54倍
1. SIM模型的架构图如下,主要分为2步:
①GSU(General Search Unit)模块,用于搜索超长的用户行为序列,与当前item匹配;
②ESU(Exact Search Unit)模块,使用搜索到的信息放入MHA中,优化模型效果;
2. GSU模块分为Hard-search和Soft-search;
3. 线上逻辑如下图:
实验
4. Dataset
5. Baseline
①DIN;
②MIMN;
③SIM;
6. 实验结果
以上均为个人见解,因本人水平有限,如发现有所错漏,敬请指出,谢谢!