狄利克雷分布公式_关于狄利克雷分布的理解

最新推荐文章于 2024-07-25 15:05:43 发布

weixin_39980298

最新推荐文章于 2024-07-25 15:05:43 发布

阅读量182

点赞数

文章标签：狄利克雷分布公式

本文链接：https://blog.csdn.net/weixin_39980298/article/details/113013190

版权

本文旨在帮助初学者理解狄利克雷分布及其起源，通过伯努利过程和贝叶斯定理，解释如何从简单的二元情况扩展到多元情况。首先介绍了伯努利试验和伯努利过程，然后讨论了贝叶斯定理在更新概率密度函数中的作用，最后展示了如何从二项分布的贝塔先验推导出狄利克雷分布，强调了共轭性质在简化计算中的重要性。

摘要由CSDN通过智能技术生成

近期问的人有点多，打算写一系列“简单易懂地理解XXX系列”。

今天来讲一下dirichlet distribution和dirichlet process怎么回事。力求让刚開始学习的人看懂，并且我比較追求motivation。追求数学严谨性和简洁性的大神请移步不要看了。不喜欢看各种细节的也能够直接跳着看文中的结论。

实际上这是学习nonparametric bayesian里常见的困惑。有些同学碰到paper或者PPT读着读着发现怎么就弄出一个dirichlet distribution了？这里面有什么intuition吗？

读三遍：要想简单地理解，还得要先从简单的样例讲起。

要想易懂地理解dirichlet distribution，首先先得知道它的特殊版本号beta distribution干了什么。

而要理解beta distribution有什么用。还得了解Bernoulli process。

首先先看Bernoulli process。要理解什么是Bernoulli process，首先先看什么Bernoulli trial。Bernoulli trial简单地说就是一个仅仅有两个结果的简单trial，比方抛硬币。

那我们就用抛一个(不均匀)硬币来说好了，X = 1就是头，X = 0就是字。我们设定q是抛出字的概率。

那什么是bernoulli process？就是从Bernoulli population里随机抽样，或者说就是反复的独立Bernoulli trials，再或者说就是狂抛这枚硬币n次记结果吧(汗=_=)。

好吧，我们就一直抛吧，我们记下X=0的次数k.

如今问题来了。

Q：我们怎样知道这枚硬币抛出字的概率？我们知道。假设能够一直抛下去，最后k/n一定会趋近于q；但是现实中有非常多场合不同意我们总抛硬币，比方我仅仅同意你抛4次。你该怎么回答这个问题？显然你在仅仅抛4次的情况下。k/n基本不靠谱；那你仅仅能"猜一下q大致分布在[0,1]中间的哪些值里会比較合理",但绝不可能得到一个准确的结果比方q就是等于k/n。

举个样例，比方：4次抛掷出现“头头字字”，你肯定认为q在0.5附近比較合理，q在0.2和0.8附近的硬币抛出这个结果应该有点不太可能。q = 0.05和0.95那是有点扯淡了。

你假设把这些值画出来，你会发现q在[0,1]区间内呈现的就是一个中间最高，两边低的情况。从感性上说。这样应当是比較符合常理的。

那我们假设有个什么工具能描写叙述一下这个q可能的分布就好了，比方用一个概率密度函数来描写叙述一下?

这当然能够，但是我们还须要注意还有一个问题。那就是随着n增长观測变多，你每次的概率密度函数该怎么计算？该怎么利用曾经的结果更新(这个在形式上和计算上都非常重要)？

到这里，事实上非常自然地会想到把bayes theorem引进来，由于Bayes能随着不断的观測而更新概率；并且每次仅仅须要前一次的prior等等…在这先不多说bayes有什么好，接下来用更形式化语言来讲事实上说得更清楚。

我们如今用更正规的语言又一次整理一下思路。如今有个硬币得到random sample X = (x1,x2,...xn)，我们须要基于这n次观察的结果来估算一下q在[0,1]中取哪个值比較靠谱，由于我们不能再用单一一个确定的值描写叙述q。所以我们用一个分布函数来描写叙述：有关q的概率密度函数(说得再简单点。即是q在[0,1]“分布律”)。当然，这应当写成一个条件密度：f(q|X)，由于我们总是观測到X的情况下。来猜的q。

如今我们来看看Bayes theorem。看看它能带来什么不同：

p><p>tex=P%28q%7Cx%29+P%28x%29+%3D+P%28X%3Dx%7Cq%29P%28q%29