python 计算概率_【第三章概率论】3.3 期望与方差+参数的估计

最新推荐文章于 2023-12-15 11:09:26 发布

weixin_39840729

最新推荐文章于 2023-12-15 11:09:26 发布

阅读量500

点赞数

文章标签： python 计算概率

本文链接：https://blog.csdn.net/weixin_39840729/article/details/113489666

版权

本文介绍了期望和方差的基本概念及其在离散与连续分布中的计算，涉及高斯分布、均匀分布等实例。此外，讲解了协方差、相关系数和协方差矩阵，以及矩估计和极大似然估计在参数估计中的应用，包括Python实战演示。

摘要由CSDN通过智能技术生成

掌握目标：

1、掌握期望和方差的意义，以及常用离散或连续分布期望方差的计算

2、掌握期望和方差的性质

3、掌握协方差，相关系数，协方差矩阵

4、掌握矩估计和极大似然估计算法

1 期望和方差

期望：连续求积，离散求和

指数分布

证明均匀分布

证明高斯分布

证明01分布

证明二项分布

证明泊松分布

方差

证明：

跳过复杂项然后直接利用上述的D(X)

例子：

我非常不理解为什么：

$equation?tex=%5Csum_%7Bk%3D2%7D%5E%7B%2B%5Cinfty%7D%7B%5Cfrac%7B%5Clambda%5E%7Bk-2%7D%7D%7Bk-2%7D%7D%3D%5Cvarrho%5E%7B%5Clambda%7D$ ，

貌似是因为泰勒公式，看到同学如果知道请告诉我！

常用例子：

方差性质

2 协方差

协方差和相关系数

协方差性质

可以用柯西不等式证明相关系数是少于等于1

协方差矩阵

协方差矩阵是对称矩阵

多维概率分布的密度函数。比如高斯，一元高斯概率分布：

n维正态随机变量的概率密度定义，n=1时退化为一元高斯概率分布，利用协方差矩阵可以把多维的正态随机变量的概率密度写出来

3。矩估计

【参数估计】讲 -> 矩估计+极大似然估计

概率密度函数来计算u1和u2，用矩估计来计算u1和u2，矩估计求均衡分布的最大释然估计

高斯分布的矩估计量

有个公式：

$equation?tex=%5Cfrac%7B1%7D%7Bn%7D%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%7BX_%7Bi%7D%5E%7B2%7D%7D-%5Cbar%7BX%7D_%7B%7D%5E%7B2%7D+%3D+%5Cfrac%7B1%7D%7Bn%7D%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%7B%28X_%7Bi%7D-%5Cbar%7BX%7D%29%5E%7B2%7D%7D$

4 极大似然估计

概念

现实中任何随机变量的概率分布函数都是未知的。

如果假定随机变量服从某种分布（如正态分布），可以通过统计手段来计算该分布的参数，这种方法称为参数估计。

极大似然估计（Maximum Likelihood Estimate, MLE）是一种参数估计的方法，利用已知样本结果，反推最大可能导致这样结果的参数值。

似然估计思想，取对数，求最大值

01分布的最大似然估计

高斯分布的最大似然估计

01分布的最大似然估计

有个总结：

高斯分布的矩估计 = 最大似然估计

均衡分布的矩估计

最大似然估计

机器学习里面为这个问题建立一个模型（概率分布，变量和参数）我们要做的就是如何估计出这个参数

。

用的最多的就是最大似然估计。从概率角度来讲，在本节中我们用的估计，矩估计和最大似然估计。

求最大似然估计量的一般步骤：

（1）写出似然函数；

（2）对似然函数取对数，并整理；

（3）求导数；

（4）解似然方程。

最大似然估计的特点：

1.比其他估计方法更加简单；

2.收敛性：无偏或者渐近无偏，当样本数目增加时，收敛性质会更好；

3.如果假设的类条件概率模型正确，则通常能获得较好的结果。但如果假设模型出现偏差，将导致非常差的估计结果。

【打卡作业】：

1、

期望

方差

2、

3、

4、

（需要自己学习一下无偏估计的概念哦）

5、编程实现高斯分布参数估计

参考：python简单实现最大似然估计&scipy库的使用

python简单实现最大似然估计&scipy库的使用_Python_Smile-CSDN博客blog.csdn.net

from scipy.stats import norm
import matplotlib.pyplot as plt
import numpy as np

'''
norm.cdf 返回对应的累计分布函数值
norm.pdf 返回对应的概率密度函数值
norm.rvs 产生指定参数的随机变量
norm.fit 返回给定数据下，各参数的最大似然估计（MLE）值
'''
x_norm = norm.rvs(size=200)
#在这组数据下，正态分布参数的最大似然估计值
x_mean, x_std = norm.fit(x_norm)
print ('mean, ', x_mean)
print ('x_std, ', x_std)
plt.hist(x_norm, normed=True, bins=15)#归一化直方图（用出现频率代替次数），将划分区间变为 20（默认 10）
x = np.linspace(-3,3,50)#在在(-3,3)之间返回均匀间隔的50个数字。
plt.plot(x, norm.pdf(x), 'r-')
plt.show()

mean, -0.0033407114846500095

x_std, 0.9980981881358523

参考：[(机器学习)概率统计]极大似然估计MLE原理+python实现

[(机器学习)概率统计]极大似然估计MLE原理+python实现_Python_PJZero-CSDN博客blog.csdn.net

 '''
    [(机器学习)概率统计]极大似然估计MLE原理+python实现
'''
    import numpy as np
    import matplotlib.pyplot as plt

    mu = 30  # mean of distribution
    sigma = 2  # standard deviation of distribution
    x = mu + sigma * np.random.randn(10000)


    def mle(x):
        """
        极大似然估计
        :param x:
        :return:
        """
        u = np.mean(x)
        return u, np.sqrt(np.dot(x - u, (x - u).T) / x.shape[0])


    print(mle(x))
    num_bins = 100
    plt.hist(x, num_bins)
    plt.show()

(29.9880960348032, 2.0112869050062114)

参考：Python实现极大似然估计

Python实现极大似然估计_python_XerCis的博客-CSDN博客blog.csdn.net

import numpy as np
from scipy.stats import norm
import matplotlib.pyplot as plt

μ = 30  # 数学期望
σ = 2  # 方差
x = μ + σ * np.random.randn(10000)  # 正态分布
plt.hist(x, bins=100)  # 直方图显示
plt.show()
print(norm.fit(x))  # 返回极大似然估计，估计出参数约为30和2

(30.03021353964129, 2.0117649664307473)

备注：如果不了解Python语言和Numpy库相关知识的童靴，请先去学习我们的Python基础+数据科学入门训练营哦~或者先自学一下官方文档了解基础知识：

https://www.numpy.org.cn/user/quickstart.html#基本操作

https://docs.python.org/zh-cn/3/

weixin_39840729

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python 计算概率_【第三章 概率论】3.3 期望与方差+参数的估计

python 计算概率_【第三章概率论】3.3 期望与方差+参数的估计