LDA 主题模型 学习

LDA 笔记:

一个函数:Gamma 函数
四个分布:二项分布、多项分布,beta分布、Dirichlet分布
一概一理:共轭先验、贝叶斯框架
两个模型:pLSA、LDA
一个采样:Gibbs采样

​ 单词 =》文档 =》 主题
​ 特征 =》简历 =》好坏

Latent Dirichlet Allocation,无监督贝叶斯模型,一种主题模型,可求解文档集中每篇文档的主题的概率分布模型
生成模型 只需要给定文档集 和 指定主题的数量 k,对于生成的每个主题,均可找出一些词语来描述。

​ ·一种典型的词袋模型,一个文档只是一组 单词的集合,不考虑单词的先后关系;
​ ·一篇文档可包含多个主题;
​ ·一个单词由某个主题生成;

贝叶斯公式
P ( B i ∣ A ) = P ( B ) P ( A ∣ B i ) ∑ j = 1 n P ( B j ) P ( A ∣ B j ) P\left( B_i|A \right) =\frac{P\left( B \right) P\left( A|B_i \right)}{\sum_{j=1}^n{P\left( B_j \right) P\left( A|B_j \right)}} P(BiA)=j=1nP(Bj)P(ABj)P(B)P(ABi)
​ 无监督的贝叶斯模型,一种主题模型

实际上由 条件概率公式 推演而来:
条件概率公式: P ( B ∣ A ) A 发生的情况下 B 的概率 = P ( A B ) A B 都发生的概率 P ( A )     A 发生的概率    ⇒ P ( A B ) = P ( A ) P ( B ∣ A ) = P ( B ) P ( A ∣ B ) = P ( B A ) P ( B ∣ A ) = P ( A B ) P ( A ) = P ( B ) P ( A ∣ B ) P ( A ) 若 ∑ i = 1 n P ( B i ) = 1,则 P ( A ) = ∑ i = 1 n P ( A B i ) = ∑ i = 1 n P ( B i ) P ( A ∣ B i ) ,代入有: P ( B ∣ A ) = P ( B ) P ( A ∣ B ) P ( A ) = P ( B ) P ( A ∣ B ) ∑ i = 1 n P ( B i ) P ( A ∣ B i ) \text{条件概率公式:}P\left( B|A \right) _{A\text{发生的情况下}B\text{的概率}}=\frac{P\left( AB \right) _{AB\text{都发生的概率}}}{P\left( A \right) \,\, _{A\text{发生的概率}}}\,\, \\ \Rightarrow P\left( AB \right) =P\left( A \right) P\left( B|A \right) =P\left( B \right) P\left( A|B \right) =P\left( BA \right) \\ P\left( B|A \right) =\frac{P\left( AB \right)}{P\left( A \right)}=\frac{P\left( B \right) P\left( A|B \right)}{P\left( A \right)} \\ \text{若}\sum_{i=1}^n{P\left( B_i \right)}=\text{1,则}P\left( A \right) =\sum_{i=1}^n{P\left( AB_i \right) =}\sum_{i=1}^n{P\left( B_i \right) P\left( A|B_i \right)}\text{,代入有:} \\ P\left( B|A \right) =\frac{P\left( B \right) P\left( A|B \right)}{P\left( A \right)}=\frac{P\left( B \right) P\left( A|B \right)}{\sum_{i=1}^n{P\left( B_i \right) P\left( A|B_i \right)}} 条件概率公式:P(BA)A发生的情况下B的概率=P(A)A发生的概率P(AB)AB都发生的概率P(AB)=P(A)P(BA)=P(B)P(AB)=P(BA)P(BA)=P(A)P(AB)=P(A)P(

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值