1.LFM模型通过隐含特征联系用户与物品
2.LFM模型主要思想是对物品的兴趣进行分类,对于某个用户,首先得到他的兴趣 分类,再从分类中挑选他可能喜欢的物品
3.负采样样本数目要平衡且尽可能选择热门且用户没有行为的物品
4.LFM模型一般采用SGD求解
1.LFM模型介绍
隐语义模型(Latent Factor Model,LFM)属于机器学习算法,它通过隐含特征联系用户与物品。主要思想是:对物品的兴趣进行分类,对于某个用户,首先得到他的兴趣分类,再从分类中挑选他可能喜欢的物品。
隐语义模型将矩阵R分解为P和Q的乘积,即通过矩阵中的物品类别将用户User和物品Item联系起来。实际上需要根据用户当前的物品偏好信息R进行计算,得到相应的矩阵P和矩阵Q.
R矩阵表示用户对物品的偏好信息,Rij代表User i对Item j的兴趣度
P矩阵表示用户对各物品类别的一个偏好信息,Pij代表User i对Class j的兴趣度
Q矩阵表示各个物品归属到各个类别的信息,Qij代表Item j在类别Class i的权重或概率
从隐语义模型可以得到用户对物品兴趣度公式:
2.LFM模型样本
推荐系统的用户行为分为显性反馈数据集(评分数据)和隐性反馈数据集。LFM在显性反馈数据上很好解决了评分预测问题(这里没有正负样本之分)。
而在隐性反馈数据集上,有正负样本之分。因为对于热门推荐而用户没有浏览或表达过偏好的商品,用户很大概率是看到的,但却没有行为,说明用户不喜欢这一类商品。人们发现,对于负采样应该遵循以下原则:
对每个用户,要保证正负样本的平衡(数目相似);
对每个用户采样负样本时,要选取那些很热门而用户没有行为的物品
3.LFM模型求解
一般采用最优化损失函数求解P和Q: