![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
自然语言处理
zxp15
这个作者很懒,什么都没留下…
展开
-
关于PLSA的一个参数公式的解释
看PLSA的论文,一开始就蹦出两个公式,涉及到参数P(w|d): 第一个公式还没什么,第二个就没法直接推出来了,直接推得到的结果是: 那么为什么会变成第二个公式呢? 原因在于:引入表示topic的z后,我们就假设w与d是相互独立的,即:P(d,w)=P(d)*P(w),P(w|d)=P(w),P(w|z,d)=P(w|z)。 于是第二、三个公式就等价了。原创 2015-08-27 16:08:33 · 411 阅读 · 0 评论 -
关于熵的数学基础
第一次写博客,呵呵。 在看自然语言处理的一个课件里关于“熵”一部分,本文记录一些基本公式和一些自己的理解。 部分文字和公式的图片是直接从ppt中拿下来的,侵删。 什么是熵?课件里的原话:熵又称为自信息(self-information),表示信 源 X 每发一个符号(不论发什么符号)所提供的 平均信息量。熵也可以被视为描述一个随机变 量的不确定性的数量。一个随机变量的熵越大, 它的不原创 2015-07-24 14:28:39 · 2223 阅读 · 0 评论