机器学习中有关概率论的问题（均匀分布、β分布、多变量正态分布、伯努利分布、和连续分布的KL散度）

最新推荐文章于 2024-05-01 09:47:37 发布

桥一Joy

最新推荐文章于 2024-05-01 09:47:37 发布

阅读量1.8k

点赞数

分类专栏： python 文章标签：机器学习概率论统计学

本文链接：https://blog.csdn.net/weixin_44425932/article/details/106516151

版权

机器学习中遇到的概率论问题

1、均匀分布的均值及方差
- 1.1 解答
2、β分布证归一性，求期望与方差
- 2.1 解答
3、多变量正态分布证协方差的最大似然解及其期望
- 3.1、解答
4、伯努利分布最大似然解及其熵
- 4.1、解答
5、连续分布的KL散度
- 5.1、解答

1、均匀分布的均值及方差

连续变量x 的均匀分布定义为

$\begin{cases} \frac{1}{b-a}, & x \in[a,b], \\[2ex] 0, & x \notin [a,b] \end{cases}$
求其均值和方差。

1.1 解答

$E[x]=\int_{-\infty}^{\infty }xf(x|a,b)\textrm{d}x=\frac{1 }{b-a}\int_{a}^{b}x\textrm{d}x=\frac{a+b}{2}$
$E[x^{2}]=\int_{-\infty}^{\infty }x^{2}f(x|a,b)\textrm{d}x=\frac{1 }{b-a}\int_{a}^{b}x^{2}\textrm{d}x=\frac{a^{2}+ab+b^{2}}{3}$
$\mathrm{var}[x]=E[x^{2}]-E[x]^{2}=\frac{a^2+ab+b^2}{3}-(\frac{a+b}{2})^{2}=\frac{(b-a)^2}{12}$

2、β分布证归一性，求期望与方差

贝塔分布是定义在 $(0, 1)$ 区间上含两个参数的⼀类连续分布，参数为 $(\alpha, \beta)$ 的贝塔概率密度函数为
$f(x|\alpha,\beta)=\frac{ \Gamma (\alpha+\beta)}{\Gamma(\alpha)\Gamma(\beta)}x^{\alpha-1}(1-x)^{\beta-1},$
试证

(a)归一性
$\int_{0}^{1}f(x|\alpha,\beta)\mathrm{d}x=1$

(b)期望
$E[x]=\frac{\alpha}{\alpha+\beta}$

$(c)$ ⽅差
$\mathrm{var}[x]=\frac{\alpha\beta}{(\alpha+\beta)^2(\alpha+\beta+1)}$

2.1 解答

(a) 贝塔函数 $B(\alpha ,\beta )=\int_{0}^{1}x^{\alpha -1}(1-x)^{\beta -1}\mathrm{d}x$ 与伽马函数 $\Gamma \left ( \alpha \right )=\int_{0}^{\infty }e^{-x}x^{\alpha -1}\mathrm{\mathrm{d}}x$ 的关系为
$B\left ( \alpha +\beta \right )=\frac{\Gamma (\alpha )\Gamma (\beta )}{\Gamma (\alpha +\beta )}$
由此易证归⼀性。另外，贝塔概率密度函数可表⽰为
$f(x|\alpha ,\beta )=\frac{1}{B(\alpha ,\beta )}x^{\alpha -1}(1-x)^{\beta -1}$

(b) 贝塔分布的 $n$ 阶矩为
$\begin{aligned} E[x^{n}]&=\frac{1}{B(\alpha ,\beta )}\int_{0}^{1}x^{n}x^{\alpha -1}(1-x)^{\beta -1}\mathrm{d}x=\frac{B(n+\alpha ,\beta )}{B(\alpha ,\beta )} \\ &= \frac{\Gamma (n+\alpha )\Gamma (\beta )}{\Gamma (n+\alpha +\beta )}\frac{\Gamma (\alpha +\beta )}{\Gamma (\alpha )\Gamma (\beta )}=\frac{\Gamma (n+\alpha )}{\Gamma (n+\alpha +\beta )}\frac{\Gamma (\alpha +\beta )}{\Gamma (\alpha )} \end{aligned}$
令 $n = 1, 2$ ，并结合伽马函数的性质 $\Gamma(\alpha + 1) = \alpha\Gamma(\alpha)$ 可得
$E[x]=\frac{\Gamma (1+\alpha )}{\Gamma (1+\alpha +\beta )}\frac{\Gamma(\alpha +\beta )}{\Gamma (\alpha )}=\frac{\alpha }{\alpha +\beta }$
$E[x^2]=\frac{\Gamma (2+\alpha )}{\Gamma (2+\alpha +\beta )}\frac{\Gamma(\alpha +\beta )}{\Gamma (\alpha )}=\frac{\alpha(\alpha +1) }{(\alpha +\beta)(\alpha +\beta +1) }$

$(c)$ 贝塔分布的⽅差为
$\mathrm{var}[x]=E[x^2]-E[x]^2=\frac{\alpha(\alpha +1) }{(\alpha +\beta)(\alpha +\beta +1) }-\frac{\alpha ^{2}}{(\alpha +\beta )^2}=\frac{\alpha \beta }{(\alpha +\beta )^2(\alpha +\beta +1)}$

3、多变量正态分布证协方差的最大似然解及其期望

设 $\mathbf{X} \sim N(\mathbf{\mu}, \mathbf{\Sigma)}, \mathbf{\mu}\in R^D, \mathbf{\Sigma}\in R^{D*D}$ (多变量正态分布)，即
$p(x|\mathbf{\mu} ,\mathbf{\Sigma} )=N(x|\mathbf{\mu ,\mathbf{\Sigma}} )=\frac{1}{(2\pi )^{\frac{D}{2}}\left | \mathbf{\Sigma} \right |^{\frac{1}{2}}}exp{-\frac{1}{2}(x-\mu)^T\mathbf{\Sigma} ^{-1}(x-\mathbf{\mu})}$
设数据集 $D = (x_{1}, ... , x_N)$ 是独⽴地从 $N(\mathbf{\mu}, \mathbf{\Sigma})$ 中抽样⽽得到的。证明

(a) 期望的最⼤似然估计为
$\mu_{ML}=\frac{1}{N}\sum_{n=1}^{N}x_n$

(b) 协⽅差的最⼤似然解为

最低0.47元/天解锁文章

桥一Joy

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
机器学习中有关概率论的问题（均匀分布、β分布、多变量正态分布、伯努利分布、和连续分布的KL散度）

机器学习中遇到的概率论问题1、均匀分布的均值及方差1.1 解答2、β分布证归一性，求期望与方差2.1 解答3、多变量正态分布证协方差的最大似然解及其期望解答4、伯努利分布最大似然解及其熵5、连续分布的KL散度1、均匀分布的均值及方差连续变量x 的均匀分布定义为U(x∣a,b)={1b−a,x∈[a,b],0,x∉[a,b]U(x|a,b) = \begin{cases}\frac{1}{b-a}, & x \in[a,b], \\[2ex]0, & x \notin [a,
复制链接

扫一扫