python 计算概率_【第三章 概率论】3.3 期望与方差+参数的估计

本文介绍了期望和方差的基本概念及其在离散与连续分布中的计算,涉及高斯分布、均匀分布等实例。此外,讲解了协方差、相关系数和协方差矩阵,以及矩估计和极大似然估计在参数估计中的应用,包括Python实战演示。
摘要由CSDN通过智能技术生成

0d3e2c8e6e8abd0cca8efed96cc6c9ce.png

掌握目标:

1、掌握期望和方差的意义,以及常用离散或连续分布期望方差的计算

2、掌握期望和方差的性质

3、掌握协方差,相关系数,协方差矩阵

4、掌握矩估计和极大似然估计算法

1 期望和方差

期望:连续求积,离散求和

f6cad840d73dea92271427ace9ac1280.png
指数分布

5a9fdd1dfd7a8ca8e209d5ec824c2579.png
证明均匀分布

78406f544082ee3b4a5edea2094a66c3.png
证明高斯分布

2da36e6d3fb9745dcfaa6f0b78b7bd0c.png

eada6dfb8d5a619ddfab6c52710da1df.png
证明01分布

d6b634a04f972849ceb09f7902dcfa4e.png
证明二项分布

a62180d134bfa8bd7704971f2a67e505.png
证明泊松分布

5232c2458861d09336960aa0bb3fe054.png

072d03391144a03a985570b54193a35e.png

9c446538fb41a82bcf54decc8198183d.png

e1971519b9ac9d39f9d2b0db23ec3452.png

方差

8aac6bb0900ac28f3de73d626db2862a.png

0cda1d37e2200ed545a9f85f09e00cb1.png

92971c30b0ed553a86bc771c506b9cda.png

证明:

133518a6325c091e5229afb6ab550352.png

86c3cb49df5f6473e5f7ae5ec6612e40.png
跳过复杂项然后直接利用上述的D(X)

例子:

7517c20e34fc9949f914f6245ef9aa7a.png

我非常不理解为什么

equation?tex=%5Csum_%7Bk%3D2%7D%5E%7B%2B%5Cinfty%7D%7B%5Cfrac%7B%5Clambda%5E%7Bk-2%7D%7D%7Bk-2%7D%7D%3D%5Cvarrho%5E%7B%5Clambda%7D
貌似是因为泰勒公式,看到同学如果知道请告诉我!

b7123c6aeffa360b3c570c5fd130c0c9.png

12243154134519e56a6db22dfee19f2d.png

常用例子:

6faff569555631c860a4fd76f6a14f5b.png
方差性质

dd84b135b5c4843335c0260585d8c04b.png

a2963c6c32c84681e968d73ce89eaad0.png

2 协方差

5cf40a7c2ed6f92e56bba4c671114454.png
协方差和相关系数

9f9501f8c2f787607b60553875d35d8f.png

0853578db0954f25f9abfed0040b37e5.png
协方差性质

67f9cf226e24141fa82c5a53626f0e03.png
可以用柯西不等式证明相关系数是少于等于1

协方差矩阵

a0a2d1c9007a5a8bc314522a3b17f4df.png
协方差矩阵

8963dd7e157c8f39383b2020952d02d5.png
协方差矩阵是对称矩阵

多维概率分布的密度函数 。比如高斯,一元高斯概率分布:

fb7936ca96253d78674f62f3d204aab6.png

a1ce335317d21a9aa90d68964641e0a1.png
n维正态随机变量的概率密度定义,n=1时退化为一元高斯概率分布,利用协方差矩阵可以把多维的正态随机变量的概率密度写出来

3。矩估计

【参数估计】讲 -> 矩估计+极大似然估计

794ded012f74b3ee647815a237bc9f38.png

de272e9ad10e2588f53caf4c103020a2.png

eefa644ecb8b75499307ba8bd0e347e5.png

5f1fa4bc5860ed1f2792f44c057d835d.png

75a3067fe796c3554915868d31e07468.png
概率密度函数来计算u1和u2,用矩估计来计算u1和u2,矩估计求均衡分布的最大释然估计

251d3ea0820c5cd68303c28e083793b5.png
高斯分布的矩估计量

有个公式:

equation?tex=%5Cfrac%7B1%7D%7Bn%7D%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%7BX_%7Bi%7D%5E%7B2%7D%7D-%5Cbar%7BX%7D_%7B%7D%5E%7B2%7D+%3D+%5Cfrac%7B1%7D%7Bn%7D%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%7B%28X_%7Bi%7D-%5Cbar%7BX%7D%29%5E%7B2%7D%7D

4 极大似然估计

概念

现实中任何随机变量的概率分布函数都是未知的。

如果假定随机变量服从某种分布(如正态分布),可以通过统计手段来计算该分布的参数,这种方法称为参数估计。

极大似然估计(Maximum Likelihood Estimate, MLE)是一种参数估计的方法,利用已知样本结果,反推最大可能导致这样结果的参数值。

13b68fa6bc271c28a3cd23b840ab6cd4.png

b442020691c21e448ee6a7c4d3427161.png
似然估计思想,取对数,求最大值

85fb30550a1106d86c518d0c9730b69f.png
01分布的最大似然估计

cdec25f9780d1dd504dfb71ae8c7fdc7.png
高斯分布的最大似然估计

db8baa1a46f7d489c4ecd2dd8466a3ee.png
01分布的最大似然估计

有个总结:

高斯分布的矩估计 = 最大似然估计

0ad2fb6d61641c7c37e3a343c1f67f68.png

均衡分布的矩估计

equation?tex=%5Cne 最大似然估计

ab769a99a3db25b6a95a2c2a1cafc54e.png

61cf3bad7338e5c188278bafc6c8e41e.png

机器学习里面为这个问题建立一个模型(概率分布,变量和参数)我们要做的就是如何估计出这个参数

equation?tex=%5Ctheta

equation?tex=f%28x%2C%5Ctheta%29

用的最多的就是最大似然估计。从概率角度来讲,在本节中我们用的估计,矩估计和最大似然估计。

求最大似然估计量的一般步骤:

(1)写出似然函数;

(2)对似然函数取对数,并整理;

(3)求导数;

(4)解似然方程。

最大似然估计的特点:

1.比其他估计方法更加简单;

2.收敛性:无偏或者渐近无偏,当样本数目增加时,收敛性质会更好;

3.如果假设的类条件概率模型正确,则通常能获得较好的结果。但如果假设模型出现偏差,将导致非常差的估计结果。

【打卡作业】:

1、

58bd8a2655857e65ad0a4a293fd38269.png

bde4ea42b605dee13da978636d72bf32.png
期望

bde7ce787ffdc428746b335dace4248d.png
方差

2、

9fdb7c8995528bca59eb0efb2ae00169.png

20b68d08914afc15fae73bee6c940e96.png

3、

cb11b40e87034f6ff4f87b92b17c6fb8.png

2412da6b17b6d053ba5265e43292f41d.png

4、

baadc64a9ff4bc8f066ed0b2fcfe5ccd.png

97046531ecf6af2502a63906aecd7893.png

(需要自己学习一下无偏估计的概念哦)

4f4bfe61f12b0eafab11997914063763.png

5、编程实现高斯分布参数估计

参考:python简单实现最大似然估计&scipy库的使用

python简单实现最大似然估计&scipy库的使用_Python_Smile-CSDN博客​blog.csdn.net
8a7008f137659a5e2ff2cf6fd7628efc.png
from scipy.stats import norm
import matplotlib.pyplot as plt
import numpy as np

'''
norm.cdf 返回对应的累计分布函数值
norm.pdf 返回对应的概率密度函数值
norm.rvs 产生指定参数的随机变量
norm.fit 返回给定数据下,各参数的最大似然估计(MLE)值
'''
x_norm = norm.rvs(size=200)
#在这组数据下,正态分布参数的最大似然估计值
x_mean, x_std = norm.fit(x_norm)
print ('mean, ', x_mean)
print ('x_std, ', x_std)
plt.hist(x_norm, normed=True, bins=15)#归一化直方图(用出现频率代替次数),将划分区间变为 20(默认 10)
x = np.linspace(-3,3,50)#在在(-3,3)之间返回均匀间隔的50个数字。
plt.plot(x, norm.pdf(x), 'r-')
plt.show()

078401b1cd93e25e558751c7bae7bfc2.png

mean, -0.0033407114846500095

x_std, 0.9980981881358523

参考:[(机器学习)概率统计]极大似然估计MLE原理+python实现

[(机器学习)概率统计]极大似然估计MLE原理+python实现_Python_PJZero-CSDN博客​blog.csdn.net
1481a1921ee0cbc4605ca7cd44cfc23b.png
 '''
    [(机器学习)概率统计]极大似然估计MLE原理+python实现
'''
    import numpy as np
    import matplotlib.pyplot as plt

    mu = 30  # mean of distribution
    sigma = 2  # standard deviation of distribution
    x = mu + sigma * np.random.randn(10000)


    def mle(x):
        """
        极大似然估计
        :param x:
        :return:
        """
        u = np.mean(x)
        return u, np.sqrt(np.dot(x - u, (x - u).T) / x.shape[0])


    print(mle(x))
    num_bins = 100
    plt.hist(x, num_bins)
    plt.show()

7f97a6bd8090990a68c116de376193b0.png

(29.9880960348032, 2.0112869050062114)

参考:Python实现极大似然估计

Python实现极大似然估计_python_XerCis的博客-CSDN博客​blog.csdn.net
1481a1921ee0cbc4605ca7cd44cfc23b.png
import numpy as np
from scipy.stats import norm
import matplotlib.pyplot as plt

μ = 30  # 数学期望
σ = 2  # 方差
x = μ + σ * np.random.randn(10000)  # 正态分布
plt.hist(x, bins=100)  # 直方图显示
plt.show()
print(norm.fit(x))  # 返回极大似然估计,估计出参数约为30和2

671e160bb5ee58ee86f99965684f60db.png

(30.03021353964129, 2.0117649664307473)

备注:如果不了解Python语言和Numpy库相关知识的童靴,请先去学习我们的Python基础+数据科学入门训练营哦~或者先自学一下官方文档了解基础知识:

https://www.numpy.org.cn/user/quickstart.html#基本操作

https://docs.python.org/zh-cn/3/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值