《Factorization Machines for Datasets with Implicit Feedback》论文阅读笔记
FM是协同过滤一种分解模型,比其他的CF模型有优势。
存在问题:FM是针对具有显式反馈(如评级)的数据集进行优化的,对于具有隐式反馈(如点击)的数据集并不是很有效。
本文:提出FM-Pair(带有成对损失函数的因式分解机,对于具有隐式反馈的数据集是有效的)。 FM-Pair中的优化模型是基于BPR(Bayesian Personalized Ranking)准则建立起来的成对优化模型。既保留了FM在通用性、表达性和性能等方面的优点,也可以用于具有隐式反馈的数据集。并将FM-Pair有效地应用于两个协同过滤问题,即上下文感知推荐和跨域协同过滤。
MF考虑学习用户,项目的隐向量;FM(与传统分解技术的不同:输入是特征向量)不仅学习用户项目的隐向量,还有它们之间的关系(借助辅助特征【用户特征,项目特征,用户-项目交互的上下文或者额外信息等】)。
FM-pair:假定所有观察到的正反馈都优于缺失的喜好。
训练数据:一个用户和一对项目(一个正项目,从用户的正反馈中获得;一个负项目,从未观察到的交互中得到),最后通过最大似然估计优化参数。