狄利克雷分布公式_Dirichlet分布及其属性

狄利克雷分布是多变量概率分布,常作为分类分布和多项分布的共轭先验。它在贝叶斯统计中扮演重要角色,尤其在处理多类别问题时。分布的边缘似然、后验预测分布和条件分布在模型推断中具有重要意义。Dirichlet分布的边缘分布是beta分布,并且具有特定的协方差矩阵结构。在生成样本时,可以利用Gamma分布进行采样。
摘要由CSDN通过智能技术生成

Dirichlet分布及其属性

Dirichlet分布

在概率统计中,Dirichlet分布通常表示为a4c26d1e5885305701be709a3d33442f.png,是一个以正实数a4c26d1e5885305701be709a3d33442f.png的向量为参数的连续多变量概率分布族。这是Beta分布的多元推广。在贝叶斯统计中,狄氏分布很多情况下可作为先验分布,其实Dirichlet分布是类别分布和多项分布的共轭先验。

狄利克雷分布向无限维度的推广便是狄利克雷过程。

Categorical分布

分类分布(有时也被不确切地称为“离散分布”或“多项分布”)从K个概率中的一个来描述事件的发生概率。参数值必须在0、1之间,它们的和为1。分类分布是伯努利分布向多类随机变量的推广。

在分布的表达式中,令采样空间是有限的整数序列。作为标签,这些整数的值并不是重要的,他们可以是{0,1,…,K-1}或{1,2,…,K}或者其他任意值。为了方便,这里我们使用{1,2,…,K}。

概率密度函数为:

a4c26d1e5885305701be709a3d33442f.png

a4c26d1e5885305701be709a3d33442f.png表示元素a4c26d1e5885305701be709a3d33442f.png发生的概率并且a4c26d1e5885305701be709a3d33442f.png

另外一种更复杂但利于数学运算的表达式:

a4c26d1e5885305701be709a3d33442f.png

a4c26d1e5885305701be709a3d33442f.png表示:如果a4c26d1e5885305701be709a3d33442f.png取值为1,否则为0.

严格意义上,分类分布可以看做是多项式分布的一种特殊形式(n=1)。

Dirichlet分布是分类分布和多项分布的共轭先验,这意味着我们可以给分类分布的未知参数a4c26d1e5885305701be709a3d33442f.png一个服从Dirichlet分布的先验分布。然后,这个参数的后验分布(结合观测数据知识后)也是个Dirichlet分布。这样我们便可以根据每次新的观测值不断的更新参数的分布模型。形式上,解释如下:

假设模型:a4c26d1e5885305701be709a3d33442f.png

我们有:a4c26d1e5885305701be709a3d33442f.png

在给定分类分布的N个抽样集时,可以利用这种关系来估计它的参数a4c26d1e5885305701be709a3d33442f.png。此时:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值