python 卡方分布函数_推断统计分析(二):python验证三大抽样分布

本文介绍了Python中卡方、T和F分布的统计概念,通过实例展示了随着样本容量增加,卡方分布趋向对称,T分布逼近正态分布,而F分布保持不对称性的特点。
摘要由CSDN通过智能技术生成

推断统计分析:

抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布是统计推断的理论基础。

一、卡方分布

若n个相互独立的随机变量ξ₁、ξ₂、……、ξn,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)。

随着卡方分布样本容量的增加,卡方分布的概率密度曲线趋于对称。当样本容量n -> +∞的时候,卡方分布 -> 正态分布,即卡方分布的极限分布就是正态分布。

x = np.linspace(0, 100, 100000)

for i in range(10, 51, 10):

y = stats.chi2.pdf(x, df=i)

plt.plot(x, y, label='n={}'.format(i))

plt.title('卡方分布随样本容量增加的变化关系图')

plt.legend()

plt.show()

随着样本容量的增加,卡方分布的概率密度曲线趋于对称。样本容量越趋近于+∞,卡方分布越趋近于正态分布。

二、T分布

设X1服从标准正态分布N(0,1),X2服从自由度为n的χ2分布,且X1、X2相互独立,则称变量t=X1(X2/n)1/2所服从的分布为自由度为n的T分布。

t分布的概率密度函数和正态分布的概率密度函数都是偶函数(左右对称的)。t分布随着样本容量的增加,就越来越接近正态分布,即t分布的极限分布也是正态分布。

当样本容量在 30-35之间时,t分布与标准正态分布难以区分

当样本容量达到120时,t分布与标准正态分布实际上完全相同了

x = np.linspace(-3, 3, 100)

plt.plot(x, t.pdf(x, 1), label='df=1')

plt.plot(x, t.pdf(x, 30), label='df=2')

plt.plot(x, t.pdf(x, 120), label='df=120')

plt.plot(x[::5], norm.pdf(x[::5]), 'kx', label='normal')

plt.legend()

plt.title('t分布随样本容量增加的变化关系图')

plt.show()

t分布一直是对称的,随着样本容量的增加,越来越趋近于正态分布,当样本容量到30时,t分布与标准正态分布难以区分,当样本容量达到120时,t分布与标准正态分布实际上完全相同了。

三、F分布

设X1服从自由度为m的χ2分布,X2服从自由度为n的χ2分布,且X1、X2相互独立,则称变量F=(X1/m)/(X2/n)所服从的分布为F分布,其中第一自由度为m,第二自由度为n。

x = np.linspace(-1, 8, 100000)

plt.plot(x, stats.f.pdf(x, 1, 10), label='m=1, n=10')

plt.plot(x, stats.f.pdf(x, 5, 10), label='m=5, n=10')

plt.plot(x, stats.f.pdf(x, 100, 10), label='m=10, n=10')

plt.ylim(0, 1)

plt.title('F分布的概率密度函数')

plt.legend()

plt.show()

F分布是不对称的,随着样本容量的增加,图形并不会趋近于正态分布。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值