《搜索和推荐中的深度匹配》——1.4 推荐匹配的挑战

重磅推荐专栏: 《Transformers自然语言处理系列教程》
手把手带你深入实践Transformers,轻松构建属于自己的NLP智能应用!

不匹配的问题在推荐中更加严重。在搜索中,查询和文档由相同语言的术语组成,这使得对它们的术语进行直接匹配至少有意义。但是,在推荐中,用户和商品通常由不同类型的特征表示,例如,用户的特征可以是用户ID,年龄,收入水平和最近的行为,而商品的特征可以是商品ID,类别,价格和品牌名称。由于用户和项目的特征来自不同语义的空间,因此基于表面特征匹配的幼稚方法不适用于推荐。更具挑战性的是,这些商品可以通过多模式特征来描述,例如服装产品的图像和电影的封面图像,它们可能在影响用户的决策中起关键作用。在这种视觉感知的场景中,我们需要考虑用户与多模式内容之间的跨模式匹配。

为了解决推荐中的不匹配挑战,提出了协同过滤原则【1】。协作过滤(CF)几乎是所有个性化推荐系统的基本基础,它假设用户可能喜欢(消费)相似用户喜欢(消费)的项目,并从历史互动中判断相似度【2】。但是,直接评估用户(项目)之间的相似性会遇到稀疏性问题,因为用户在整个项目空间中只消费了一些项目。解决稀疏性问题的典型假设是用户-项目交互矩阵是低秩的,因此可以从低维用户(和项目)潜在特征矩阵进行估算。然后,用户(项目)相似性可以更可靠地反映在潜在特征矩阵中。这导致了矩阵因式分解对于协同过滤的有效性【3】【4】,这成为了一种强大的CF方法和许多推荐模型的必要设计。

参阅 《深入理解Spark ML:基于ALS矩阵分解的协同过滤算法与源码分析》

除矩阵分解外,还开发了其他许多类型的CF方法,例如基于神经网络的方法【5】【6】和基于图的方法【7】【8】。

参阅 《CF-based 的深度模型》
《图神经网络——【NIPS 2017】GraphSAGE》
《图神经网络——【KDD 2018】PinSage》
《图神经网络——【SIGIR 2019】NGCF》

为了利用交互矩阵之外的各种辅助信息,例如用户配置文件,项目属性和当前上下文,已经提出了许多遵循标准监督学习范式的通用推荐模型。例如,通过预测项目的点击率(CTR),可以在推荐引擎的(重新)排序阶段中使用这些模型。有代表性的模型是因式分解机(FM)【9】,该模型将矩阵因式分解的低阶假设扩展为模型特征交互。

参阅《深度推荐模型——FM》

由于FM的线性和二阶交互建模限制了其表达能力,因此许多后来的工作都将其与神经网络进行了非线性和高阶交互建模的补充【10】【11】【12】。

参阅《深度推荐模型——NFM [SIGIR 17][新加坡国立大学]》
《深度推荐模型——xDeepFM [KDD 18][Microsoft]》
《深度推荐模型——DIN [KDD 18][Alibaba]》

这些神经网络模型现已在工业应用中大量使用。【13】【14】回顾了推荐系统的深度学习方法

请注意,尽管查询文档匹配和用户项目匹配对于搜索引擎和推荐系统至关重要,但这些系统还包括其他重要组件。除了匹配之外,网络搜索引擎还包括爬网,索引,文档理解,查询理解和排序等。推荐系统还包括诸如用户建模(分析),索引,缓存,多样性控制和在线浏览之类的组件等等。

引文

【1】Shi, Y., M. Larson, and A. Hanjalic (2014). “Collaborative filtering
beyond the user-item matrix: A survey of the state of the art and
future challenges”. ACM Computing Surveys. 47(1): 3:1–3:45.
【2】Sarwar, B., G. Karypis, J. Konstan, and J. Riedl (2001). “Item-based collaborative filtering recommendation algorithms”. In: Proceedings of the 10th International Conference on World Wide Web. WWW
’01. Hong Kong, Hong Kong: ACM. 285–295.
【3】Koren, Y., R. Bell, and C. Volinsky (2009). “Matrix factorization tech- niques for recommender systems”. Computer. 42(8): 30–37.
【4】Rendle, S., C. Freudenthaler, Z. Gantner, and L. Schmidt-Thieme
(2009). “BPR: Bayesian personalized ranking from implicit feedback”. In: Proceedings of the Twenty-Fifth Conference on Uncertainty in Artificial Intelligence. UAI ’09. Montreal, Quebec, Canada: AUAI Press. 452–461. url: http://dl.acm.org/citation.cfm?id=1795114.1 795167.
【5】He, X., L. Liao, H. Zhang, L. Nie, X. Hu, and T.-S. Chua (2017c). “Neural collaborative filtering”. In: Proceedings of the 26th Interna- tional Conference on World Wide Web. WWW ’17. Perth, Australia.
173–182.
【6】Liang, D., R. G. Krishnan, M. D. Hoffman, and T. Jebara (2018). “Variational autoencoders for collaborative filtering”. In: Proceedings of the 2018 World Wide Web Conference. WWW ’18. Lyon, France:
International World Wide Web Conferences Steering Committee.
689–698.
【7】Wang, X., X. He, M. Wang, F. Feng, and T.-S. Chua (2019b). “Neural graph collaborative filtering”. In: Proceedings of the 42nd Inter- national ACM SIGIR Conference on Research and Development in Information Retrieval. SIGIR’19. Paris, France: Association for Computing Machinery. 165–174.
【8】Ying, R., R. He, K. Chen, P. Eksombatchai, W. L. Hamilton, and J.
Leskovec (2018). “Graph convolutional neural networks for web-scale recommender systems”. In: Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. KDD ’18. London, UK: ACM. 974–983.
【9】Rendle, S. (2010). “Factorization machines”. In: Proceedings of the
2010 IEEE International Conference on Data Mining. ICDM ’10.
Washington, DC, USA: IEEE Computer Society. 995–1000.
【10】He, X. and T.-S. Chua (2017). “Neural factorization machines for sparse predictive analytics”. In: Proceedings of the 40th International ACM SIGIR Conference on Research and Development in Information Retrieval. SIGIR ’17. Shinjuku, Tokyo, Japan: ACM. 355–364.
【11】Lian, J., X. Zhou, F. Zhang, Z. Chen, X. Xie, and G. Sun (2018). “xDeepFM: Combining explicit and implicit feature interactions for recommender systems”. In: Proceedings of the 24th ACM SIGKDD
International Conference on Knowledge Discovery & Data Mining.
KDD ’18. London, UK: ACM. 1754–1763.
【12】Zhou, G., X. Zhu, C. Song, Y. Fan, H. Zhu, X. Ma, Y. Yan, J. Jin, H. Li, and K. Gai (2018). “Deep interest network for click-through rate prediction”. In: Proceedings of the 24th ACM SIGKDD International
Conference on Knowledge Discovery & Data Mining. KDD ’18. London, UK: Association for Computing Machinery. 1059–1068.
【13】Batmaz, Z., A. Yurekli, A. Bilge, and C. Kaleli (2019). “A review on deep learning for recommender systems: Challenges and remedies”. Artificial Intelligence Review. 52(1): 1–37.
【14】Zhang, S., L. Yao, A. Sun, and Y. Tay (2019). “Deep learning based recommender system: A survey and new perspectives”. ACM Com- puting Surveys. 52(1): Article 5.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小爷毛毛(卓寿杰)

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值