一元正态总体参数的极大似然估计_附Python实现

yuzl_wm

已于 2022-10-08 18:02:40 修改

阅读量1.7k

点赞数 5

文章标签： python 机器学习开发语言

于 2022-10-08 15:39:38 首次发布

本文链接：https://blog.csdn.net/qq_45814396/article/details/127206584

版权

文章目录

1.极大似然估计思想
2.一元正态总体参数MLE推导
3.代码实现
4.总结
参考文献
所有代码

1.极大似然估计思想

    我们获得了样本 $x_{1},x_{2},...,x_{m}$ ，这些样本被我们从总体中抽到了，从概率的角度思考，我们认为这些样本出现的概率是极大的，因此，可以构造出这些样本的联合概率函数，使得联合概率函数最大的参数值就是极大似然估计值.
    现假设随机变量 $X_{1},X_{2},...,X_{m}$ 的联合概率密度函数或联合概率质量函数为 $p(X;\pmb{\theta})$ ， $\pmb{\theta}\in \pmb{\Theta}$ ，其中 $\pmb{\theta}$ 是一个或多个未知参数组成的参数向量， $\pmb{\Theta}$ 是参数空间， $x_{1},x_{2},...,x_{m}$ 是来自总体的样本，将样本的联合概率函数看成是 $\pmb{\theta}$ 的函数，用 $L(\pmb{\theta};x_{1},x_{2},...,x_{m})$ 表示，简记为 $L(\pmb{\theta})$ .
    如果 $X_{i}$ 是i.i.d的，那么 $L(\pmb{\theta})$ 可以写为
$L(\pmb{\theta})=L(\pmb{\theta};x_{1},x_{2},...,x_{m})=\prod_{i=1}^{m} p(x_{i},\pmb{\theta })$
$L(\pmb{\theta})$ 称为样本的似然函数。如果统计量
$\hat{\pmb{\theta}}=\pmb{\hat{\theta} }(x_{1},x_{1},...,x_{m})$
满足
$L(\hat{\pmb{\theta}})=\max_{\pmb{\theta}\in \pmb{\Theta}}L(\pmb{\theta})$
则称 $\hat{\pmb{\theta}}$ 是 $\pmb{\theta}$ 的极大似然估计，简记为MLE(maximum likelihood estimate).

2.一元正态总体参数MLE推导

设样本 $x_{1},x_{2},...,x_{m}$ 来自正态总体 $N(\mu,\sigma^{2})$ ，且相互独立，则 $\pmb{\theta}=(\mu,\sigma^{2})$ .由于样本来自正态总体，则
$p(x_{i};\mu,\sigma^{2})=\frac{1}{\sqrt{2\pi}\sigma}exp\{-\tfrac{(x_{i}-\mu )^{2}}{2\sigma^{2}}\} ,i=1,2,...,m$
故样本的似然函数为
$\begin{aligned} L(\pmb{\theta})&=\prod_{i=1}^{m} p(x_{i},\pmb{\theta })\\ &=\prod_{i=1}^{m} \frac{1}{\sqrt{2\pi}\sigma}exp\{-\tfrac{(x_{i}-\mu )^{2}}{2\sigma^{2}}\} \\ &=(2\pi\sigma^{2})^{-m/2}exp\{-\frac{1}{2\sigma^{2}}\sum_{i=1}^{m}(x_{i}-\mu )^{2}\} \end{aligned}$
对数似然函数为
$\begin{aligned} lnL(\pmb{\theta})&=-\frac{m}{2}ln(2\pi)-\frac{m}{2}ln(\sigma^{2})-\frac{1}{2\sigma^{2}}\sum_{i=1}^{m}(x_{i}-\mu )^{2} \end{aligned}$
将 $lnL(\pmb{\theta})$ 对两个分量分别求偏导得
$\frac{\partial lnL(\pmb{\theta})}{\partial \mu} =\frac{1}{\sigma^{2}}\sum_{i=1}^{m}(x_{i}-\mu)=0$
$\frac{\partial lnL(\pmb{\theta})}{\partial \sigma^{2}} =\frac{1}{2\sigma^{4}}\sum_{i=1}^{m}(x_{i}-\mu)^{2}-\frac{m}{2\sigma^{2}}=0$
解上述方程组得 $\mu$ 的极大似然估计为
$\hat{\mu}=\frac{1}{m}\sum_{i=1}^{m}x_{i}=\bar{x}$
$\sigma^{2}$ 的极大似然估计为
$\hat{\sigma^{2}}=\frac{1}{m}\sum_{i=1}^{m}(x_{i}-\bar{x})^{2}$

3.代码实现

代码使用python进行实现，本文使用两种方式实现参数估计

根据估计量的表达式进行计算.
使用scipy的optimize模块进行优化.

3.1.抽取样本

import numpy as np
import matplotlib.pyplot as plt
import scipy.optimize as optim

首先从 $\mu=2,\sigma=4$ 的正态分布中抽取 $m = 100000$ 个样本

np.random.seed(10)
mu=2;sigma=4;m=100000
X=np.sort(np.random.normal(mu,sigma,m))
y=(1/np.sqrt(2*np.pi)*sigma)*np.exp(-(X-mu)**2/(2*sigma**2))

使用样本绘制图形

def plot_density(X,y,mu,sigma):
    fig=plt.Figure(figsize=(8,6))
    grid=plt.GridSpec(1,1)
    axes=fig.add_subplot(grid[0,0])
    axes.plot(X,y)
    axes.set_xlabel("x")
    axes.set_ylabel("$p(x)$")
    for dire in ['top','right']:
        axes.spines[dire].set_visible(False)
    axes.vlines(2,ymin=0,ymax=np.max(y),color='red')
    axes.text(8, 0.25, '$\mu={},\sigma={}$'.format(mu,sigma))
    fig.subplots_adjust(left=0.1, bottom=0.12, right=0.96, top=0.95, wspace=0.5, hspace=0.5)
    axes.text(mu-0.5, 0.5*np.max(y), '$x={}$'.format(mu))
    return fig
fig1=plot_density(X,y,mu,sigma)

在这里插入图片描述

3.2.根据估计量的表达式进行计算

$\mu$ 的极大似然估计为
$\hat{\mu}=\frac{1}{m}\sum_{i=1}^{m}x_{i}=\bar{x}$
$\sigma^{2}$ 的极大似然估计为
$\hat{\sigma^{2}}=\frac{1}{m}\sum_{i=1}^{m}(x_{i}-\bar{x})^{2}$
根据上述两式计算：

hat_mu=np.mean(X)
hat_sigma=np.sqrt((X-hat_mu).dot(X-hat_mu)/m)
print("The estimated value of mean:",hat_mu)
print("The estimated value of Standard deviation:",hat_sigma)

结果：
The estimated value of mean: 1.9880863402374647
The estimated value of Standard deviation: 3.9976758117844575

3.3.使用scipy的optimize模块进行优化

极大似然估计要求使得似然函数最大化的参数 $\pmb{\theta}$ ，也即
$\pmb{\hat{\theta}}=agr\max_{\pmb{\theta}\in \pmb{\Theta}}L(\pmb{\theta})$
上述优化问题等价于
$\pmb{\hat{\theta}}=agr\min_{\pmb{\theta}\in \pmb{\Theta}}-L(\pmb{\theta})$
即
$\begin{aligned} \pmb{\hat{\theta}} &=agr\min_{\pmb{\theta}\in \pmb{\Theta}}-L(\pmb{\theta})\\ &=agr\min_{\pmb{\theta}\in \pmb{\Theta}}-\{-mln(\sigma)-\frac{m}{2}ln(2\pi)-\frac{1}{2\sigma^{2}}\sum_{i=1}^{m} (x_{i}-\mu)^{2}\}\\ &=agr\min_{\pmb{\theta}\in \pmb{\Theta}}\{mln(\sigma)+\frac{m}{2}ln(2\pi)+\frac{1}{2\sigma^{2}}\sum_{i=1}^{m} (x_{i}-\mu)^{2}\} \end{aligned}$
由于右边第二项 $\frac{m}{2}ln(2\pi)$ 是常数，不影响优化，故可以去掉。
将上述极小化问题用代码实现如下：

def likelihood_func(theta,X):
	#theta表示要优化的参数向量，其中theta[0]表示均值，theta[1]表示标准差。
    m=len(X)
    z=m*np.log(theta[1])+(1/(2*theta[1]**2))*((X-theta[0]).dot(X-theta[0]))
    return z

将 $\mu_{0}=4,\sigma_{0}=8$ 作为初始点，执行优化如下：

pt=np.array([4,8])
result = optim.minimize(likelihood_func, pt,args=(X,), method='Nelder-Mead')
print('Status : %s' % result['message'])
print('Total Evaluations: %d' % result['nfev'])
solution = result['x']
print('Solution: f(%s) ' % solution)

结果：
Status : Optimization terminated successfully.
Total Evaluations: 82
Solution: f([1.98805021 3.99765954])

4.总结

本文根据极大似然估计的思想给出了极大似然估计一般定义，并推导了一元正态总体参数的极大似然估计，同时，使用两种计算方式得出了参数的极大似然估计。从两种计算结果来看，估计差异很小，且估计误差也很小。两种方式中， $\mu$ 和 $\sigma$ 的估计值均非常接近真实值。

参考文献

[1] 茆诗松,程依明,濮晓龙.概率论与数理统计教程[M]. 北京:高等教育出版社, 2019. 277-279.
[2] Rice J A. Mathematical statistics and data analysis[M]. Cengage Learning, 2006.

所有代码

#导入包
import scipy.optimize as optim
import numpy as np
from numpy.random import rand
import matplotlib.pyplot as plt

#抽取样本
np.random.seed(10)
mu=2;sigma=4;m=100000
X=np.sort(np.random.normal(mu,sigma,m))
y=(1/np.sqrt(2*np.pi)*sigma)*np.exp(-(X-mu)**2/(2*sigma**2))

#绘制图形
def plot_density(X,y,mu,sigma):
    fig=plt.Figure(figsize=(6,4))
    grid=plt.GridSpec(1,1)
    axes=fig.add_subplot(grid[0,0])
    axes.plot(X,y)
    axes.set_xlabel("x")
    axes.set_ylabel("$p(x)$")
    for dire in ['top','right']:
        axes.spines[dire].set_visible(False)
    axes.vlines(2,ymin=0,ymax=np.max(y),color='red')
    axes.text(8, 0.25, '$\mu={},\sigma={}$'.format(mu,sigma))
    fig.subplots_adjust(left=0.1, bottom=0.12, right=0.96, top=0.95, wspace=0.5, hspace=0.5)
    axes.text(mu-0.5, 0.5*np.max(y), '$x={}$'.format(mu))
    return fig
fig1=plot_density(X,y,mu,sigma)

#根据估计量的表达式进行计算
hat_mu=np.mean(X)
hat_sigma=np.sqrt((X-hat_mu).dot(X-hat_mu)/m)
print("The estimated value of mean:",hat_mu)
print("The estimated value of Standard deviation:",hat_sigma)

#使用scipy的optimize模块进行优化
def likelihood_func(theta,X):
    m=len(X)
    z=m*np.log(theta[1])+(1/(2*theta[1]**2))*((X-theta[0]).dot(X-theta[0]))
    return z
pt=np.array([4,8])
result = optim.minimize(likelihood_func, pt,args=(X,), method='Nelder-Mead')
print('Status : %s' % result['message'])
print('Total Evaluations: %d' % result['nfev'])
solution = result['x']
print('Solution: f(%s) ' % solution)

yuzl_wm

关注

5
点赞
踩
26

收藏

觉得还不错? 一键收藏
打赏
1
评论
一元正态总体参数的极大似然估计_附Python实现

本文根据极大似然估计的思想给出了极大似然估计一般定义，并推导了一元正态总体参数的极大似然估计，同时，使用两种计算方式得出了参数的极大似然估计。从两种计算结果来看，估计差异很小，且估计误差也很小。两种方式中，\muμ和\sigmaσ的估计值均非常接近真实值。
复制链接

扫一扫