深度学习和自然语言处理的应用和脉络4-隐语义模型SVD,PLSA,LDA,LFM-推荐系统

隐语义模型LFM和LSI,LDA,Topic Model其实都属于隐含语义分析技术,是一类概念,他们在本质上是相通的,都是找出潜在的主题或分类。这些技术一开始都是在文本挖掘领域中提出来的,近些年它们也被不断应用到其他领域中,并得到了不错的应用效果。比如,在推荐系统中它能够基于用户的行为对item进行自动聚类,也就是把item划分到不同类别/主题,这些主题/类别可以理解为用户的兴趣。


SVD:奇异值分解,一般用于降维度。

PLSA:由于超大矩阵的SVD计算很复杂,所以使用概率版本的PLSA。使用EM求解。

LDA:高级版本的PLSA。

LFM:Latent factor mode

LFM具体求解公式。


其中 Pu,k 是 分解后左边的矩阵中的元素。Qi,k 是分解后右边矩阵的元素。Rui是已经评分的元素。后面的两项是正则化项。这样就形成了目标函数。使用梯度下降法求解。这样就可以求解 每一个合适的 Qi,k Rui ,使用最后的乘积就可以求解整个原始矩阵。

PLSA,LDA 参考 http://blog.csdn.net/pipisorry/article/details/42560693

LFM  参考:http://blog.csdn.net/litoupu/article/details/16944359


推荐系统技术架构:

1 首先给基于评分矩阵,或者系统过滤。经过排序,给出大约小于100个的粗推荐结果。(粗推荐)

2 然后拿到用户画像和商品画像,进行进一步的计算。比如  xgboost 。(精推荐)

    



没有更多推荐了,返回首页