LDA 主题模型的几种概率分布

这篇博客总结了LDA主题模型中的基础概率分布,包括伯努利、二项式、多项式、beta和Dirichlet分布。博主强调了概率密度函数和分布函数的区别,并探讨了二项分布与Beta分布、多项式分布与Dirichlet分布的关系,特别是在参数估计中的应用和共轭先验概念。
摘要由CSDN通过智能技术生成

学习机器学习模型的时候才发现概率知识缺很多啊啊啊……,还好重新捡起来比学习新东西还是简单很多
把LDA里面的几个基础概率分布简单总结一下。

概率密度函数和概率分布函数

概率密度函数和概率分布函数分别是什么,区别是什么,你还记得吗?嗯,先试着回想一下。以前看到总觉得很简单,就在眼前一闪而过,真正用到的时候就用的很不顺手啊。

概率密度函数

PDF – Probability Density Function
机器学习里面的朴素贝叶斯、EM算法、混合高斯模型、sampling 等都要用到这个东东。
它表述的意义是在某个确定的点(附近)事件发生的可能性。
对离散型随机变量:

fX(x)=p(X=x)

对连续型随机变量,存在 fX(x) , 满足
1. fX(x)>0
2. +fX(x)=1
3. p(a<X<b)=bafX(x)

分布函数

CDF – Cumulative Distribution Function
表示随机变量小于等于某一取值 x 的概率。

FX(x)=p(Xx)

对连续型随机变量

FX(x)=xfX(x)


伯努利分布

XBernoulli(p)
这个应该是我们学的最简单的分布函数
就是对单次抛硬币进行建模

f(x)=px(1p)1x x={ 0,1}

直观点就是:
f(x)={ px=11px=0

二项式分布

XBinomial(p,n)
二项分布就是重复 n 次的伯努利实验模型。 n 次实验中,一种情况出现 k 次, 另一种情况出现 nk 次,这样的实验结果出现的概率是多少。

f(k)=P(X=k|p,n)=Cknpk(1p)(nk)=n!k!(nk)!pk(1p)(nk)

多项式分布

XMultinormal(p⃗ ,n)
抛硬币只有两种情况发生,如果一件事可能出此案多种结果,比如说掷筛子,那么可以用多项式分布进行建模
p⃗ =(

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值