PLSA的理解及推导

        plsa对于文本主题的发展,在于其对于lsa进行了概率化,也就是文档的生成过程涉及到了选择主题,然后从主题中选择单词的过程,这二个选择的过程都满足多项式分布的情况。

       对于PLSA而言,就是一个典型的EM算法问题呀。主题就是隐含变量,已知变量就是单词,文本的情况。再求解EM算法时,首先要明确极大化的对数似然函数,然后求E步,E步求解中首先要把隐含变量的条件概率求出来,然后求Q函数,然后再求M,也就是求期望最大的情况,得到参数的估计值,不断迭代,直到收敛。然后就把我们想要知道得参数求出来了。知道参数了,其中的一个副产品,可以说是词向量了。

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值