看PLSA的论文,一开始就蹦出两个公式,涉及到参数P(w|d):
第一个公式还没什么,第二个就没法直接推出来了,直接推得到的结果是:
那么为什么会变成第二个公式呢?
原因在于:引入表示topic的z后,我们就假设w与d是相互独立的,即:P(d,w)=P(d)*P(w),P(w|d)=P(w),P(w|z,d)=P(w|z)。
于是第二、三个公式就等价了。
看PLSA的论文,一开始就蹦出两个公式,涉及到参数P(w|d):
第一个公式还没什么,第二个就没法直接推出来了,直接推得到的结果是:
那么为什么会变成第二个公式呢?
原因在于:引入表示topic的z后,我们就假设w与d是相互独立的,即:P(d,w)=P(d)*P(w),P(w|d)=P(w),P(w|z,d)=P(w|z)。
于是第二、三个公式就等价了。