- 博客(3)
- 资源 (3)
- 收藏
- 关注
原创 LDA 主题模型
背景我们生活中总是产生大量的文本,分析这些观察到的语料库是如何生成的就需要对文本进行建模。常见的文本建模方法包括:Unigram、PLSA、LDA 、词向量模型(CBOW、Skip-gram)等。LDA模型是一种主题模型(topic model),属于词袋(不关心词与词之间的次序)模型。模型描述人类所产生的所有语料文本我们都可以看成是上帝抛骰子生成的。我们观察到的只是上帝玩这个游戏的结果——词序列构
2018-01-13 10:02:33 5731
原创 共轭先验分布
背景贝叶斯估计贝叶斯参数估计的思考过程可以用下面这个公式说明: 先验分布+数据的知识=后验分布 (∗)先验分布+数据的知识=后验分布\ \ \ \ \ (*)共轭先验分布的提出当没有任何观察数据时,随机变量 θ\theta 服从概率分布 P(θ)P(\theta)当观测到新的数据 XX 时,有如下问题: 可否根据新观测到的数据XX,更新参数 θ\theta
2018-01-11 15:23:54 3755 1
原创 Gamma分布、Beta分布、Dirichlet分布
Γ\Gamma 函数Γ\Gamma 函数是阶乘在实数上的推广,定义为: Γ(x)=∫+∞0tx−1e−t dt\Gamma(x) = \int_{0}^{+\infty} t^{x-1} e^{-t} \ dt Γ\Gamma 函数的性质: Γ(x+1)=xΓ(x)\Gamma(x+1) = x \Gamma(x) Γ(n)=(n−1)!\Gamma(n) = (n-1)!Gam
2018-01-10 18:47:51 24508 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人