CTR模型:跨域混合兴趣网络Minet
最近在做推荐系统的项目,在此对跨域CTR模型混合兴趣网络MiNet: Mixed Interest Network for Cross-Domain Click-Through Rate Prediction做一个简单的笔记。本篇文章将先介绍什么是跨域,再用自顶而下的方式解读MiNet模型。
来源论文:Wentao Ouyang, Xiuwu Zhang, Lei Zhao, Jinmei Luo, Yu Zhang, Heng Zou,Zhaojie Liu, Yanlong Du. 2020. MiNet: Mixed Interest Network for CrossDomain Click-Through Rate Prediction. In Proceedings of the 29th ACM International Conference on Information and Knowledge Management (CIKM’20), October 19–23, 2020, Virtual Event, Ireland. ACM, New York, NY, USA,
8 pages. https://doi.org/10.1145/3340531.3412728
github地址:https://github.com/oywtece/minet
什么是跨域Cross-domain
什么是域?
域是某些实例聚集在一起的集合,它的定义可大可小。例如,淘宝和微信就是两个域,微信的文章和广告也是两个域。
什么是跨域?
跨域是基于重叠(overlap)的。当两个域的部分实例发生某个或者某些属性发生重叠时,我们认为这些实例跨域了。比如当某个新闻和某个广告的观众属性相同,我们认为这两个实例跨域了。
为什么要跨域推荐?
这里直接引用原文(翻译):
现有的工作主要针对单一领域CTR预测,即仅利用ad数据进行CTR预测,并对特征交互、用户行为历史和上下文信息等方面进行建模。然而,广告通常伴随着自然内容显示,这为跨域CTR预测提供了机会。在本文中,我们解决了这个问题,并利用源域的辅助数据来提高目标域的CTR预测性能。我们的研究基于UC今日头条(如下图),源域为自然新闻feed(新闻域),目标域为广告(广告域)。跨域的一个主要优势CTR预测是指通过跨域丰富数据,可以缓解目标域的数据稀疏性和冷启动问题,从而提高预测性能。