LFM_隐语义模型_laten factor model

最新推荐文章于 2021-04-28 17:46:45 发布

ChengSlime

最新推荐文章于 2021-04-28 17:46:45 发布

阅读量280

点赞数

文章标签：机器学习算法数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ChengSlime/article/details/93981267

版权

LFM前世今生

源于SVD(奇异值分解)方法的改进，传统svd是线性代数典型问题；
SVD可用于矩阵评分矩阵的补全，但由于计算量过大，实际上只适用于规模很小的系统

Simon Funk 改进SVD（Funk-SVD），后来被称为LFM

LFM
关键公式
LFM通过如下公式计算用户u对i的兴趣
LFM公式
这个公式中 p_uk 和 q_ik 是模型的参数，其中p_uk度量了用户u的兴趣和第k个隐类的关系，而q_ik度量了第k个隐类和物品i之间的关系。那么，下面的问题就是如何计算这两个参数。

LFM 思路

在这里插入图片描述
选择一个训练集，用适当的数学计算出上述公式里待确定的权重。

隐语义模型的适用性
LFM可以很好的解决人工分类产生的问题
不能存在编辑的主观评判或专业因素限制，所有的分类和权重都来自于算法对用户数据的客观统计分析，只存在这模型适用性的问题。

关于训练集
在这里插入图片描述
对负样本采样时应该遵循以下原则：
对每个用户，要保证正负样本的平衡（数目相似）
对每个用户采样负样本时，要选取那些很热门，而用户却没有行为的物品

Q：p_u1,p_u2…,q_i1,q_i2都是未知，如何求出？
常见的求解方法
1：最大似然（类似于训练贝叶斯信念网络和EM算法）
2：转化为求解损失函数极小值的问题

在这里插入图片描述
r_ui，lamda 已知 p_uk,q_ik未知 p_u,q_i向量

LFM重要参数
模型中隐特征个数
梯度下降法中选取学习速率
损失函数中的惩罚系数lambda
训练集的负样本/正样本比例ratio

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。