概率隐语义分析和奇异值分解

推荐系统中经常用到的两个基本模型,一个是概率隐语义分析(Probabilistic Latent  Semantic Indexing简称PLSA),另一个是奇异值分解(SVD),下面分析一下二者的区别和联系。


从形式上看PLSA和SVD很像,如式(1)和 式(2),

                           (1)


                                 (2)

二者都是隐变量模型,是矩阵分解,都对原矩阵进行了降维,并且都是非监督学习。 虽然形式上很相似,但是二者在实际应用中区别还是很大的,不能混淆使用。首先,分解对象不同,在PLSA模型中,P矩阵的每个元素代表一个概率,而在SVD中,A并不要求具有概率意义,如在协同过滤中,A中每个元素代表一个评分。 其次隐变量的意义不同,虽然二者都是隐变量模型,在PLSA中隐变量代表的一个类别,是离散的,具有明确的概率意义,表示一个类别的边缘分布,而在SVD中,隐变量代表的一个方向,是连续的。第三,两种分解的优化目标不同,PLSA的分解目标是找到一组基使得似然概率取得最大值,并且基之间不一定是正交的,而SVD的优化目标是映射损失误差最小,它的基是正交的,PLSA强调的是聚类,这一点是受 z的离散性影响的,SVD强调的是找到一个隐方向,使用数据在该方向的区分度比较大。

从以上分析可以 看出,虽然二者的都是矩阵分解,都起到了降维的作用,但是PLSA重点在聚类,强调共性,而SVD在于找方向,强调差异性。如果从监督和非监督的角度考虑,PLSA对应的是分类问题,而SVD对应的是回归问题。


参考资料

probabilistic latent semantic indexing



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值