统计学基础——两个样本均值(频率)之差的分布

一、样本均值之差的定义

\overline{X}_{1}是独立的抽自总体X_{1}\sim N(\mu _{1},\sigma _{1}^{2})的一个容量为n_{1}的样本的均值。\overline{X}_{2}是独立的抽自总体X_{2}\sim N(\mu _{2},\sigma _{2}^{2})的一个容量为n_{2}的样本的均值。

则具备以下性质:

  1. E(\overline{X}_{1}-\overline{X}_{2})=E(\overline{X}_{1})-E(\overline{X}_{2})=\mu _{1}-\mu _{2} ,E(\overline{X}_{1})表示抽取多次获取样本均值\overline{X}_{1}的数学期望,根据中心极限定理,则E(\overline{X}_{1})=\mu _{1}。                                                                                                  
  2. D(\overline{X}_{1}\pm\overline{X}_{2})=D(\overline{X}_{1})+D(\overline{X}_{2})=\frac{\sigma _{1}^{2}}{n_{1}}+\frac{\sigma _{2}^{2}}{n_{2}}
  3. S(\overline{X}_{1}\pm\overline{X}_{2})=\sqrt{D(\overline{X}_{1}\pm\overline{X}_{2})}=\sqrt{\frac{\sigma _{1}^{2}}{n_{1}}+\frac{\sigma _{2}^{2}}{n_{2}}}

n_{1}n_{2}足够大的时候,一般要分别大于50,则\overline{X}_{1}-\overline{X}_{2}的抽样分布不管两样本的总体分布如何(正态或者偏态)均可看似正态分布来处理。其均值和方差求值如上面式子所示。

如果两总体为正态分布,则\overline{X}_{1}-\overline{X}_{2}也为正态分布,其均值和方差求值如上面式子所示。

【补充】

定理:设XY为两个随机变量,其均值E(X)E(Y),方差D(X)D(Y)均存在,求D(X+Y)D(X-Y)

若不相关(XY独立)的话就等于D(X\pm Y)=D(X)+D(Y)
       若相关(XY不独立)的话,就是D(X\pm Y)=D(X)+D(Y)\pm 2Cov(X,Y)

证明:X=(x_{1},x_{2},...,x_{n})Y=(y_{1},y_{2},...,y_{n}),则D(X-Y)=D(X)+D(Y)。 \begin{align} D(X-Y) &= \frac{[(x_{1}-y_{1})-E(X-Y)]^{2}+[(x_{2}-y_{2})-E(X-Y)]^{2}+\cdot \cdot \cdot +[(x_{n}-y_{n})-E(X-Y)]^{2}}{n} \\ &=\frac{[(x_{1}-y_{1})-(E(X)-E(Y))]^{2}+[(x_{2}-y_{2})-(E(X)-E(Y))]^{2}+\cdot \cdot \cdot +[(x_{n}-y_{n})-(E(X)-E(Y))]^{2}}{n} \\ &=\frac{[(x_{1}-E(X))-(y_{1}-E(Y))]^{2}+[(x_{2}-E(X))-(y_{2}-E(Y))]^{2}+\cdot \cdot \cdot +[(x_{n}-E(X))-(y_{n}-E(Y))]^{2}}{n} \\ &=\frac{[(x_{1}-E(X))^{2}+(x_{2}-E(X))^{2}+\cdot \cdot \cdot +(x_{n}-E(X))^{2}]+[(y_{1}-E(Y))^{2}+(y_{2}-E(Y))^{2}+\cdot \cdot \cdot +(y_{n}-E(Y))^{2}]}{n} \\ & -\frac{2[(x_{1}-E(X))(y_{1}-E(X))+(x_{2}-E(X))(y_{2}-E(X))+\cdot \cdot \cdot +(x_{n}-E(X))(y_{n}-E(X))]}{n} \\ &=D(X)+D(Y)-2cov(X,Y) \end{align}

 

二、样本频率之差的定义

设分别从具有参数为\pi _{1}和参数为\pi _{2}的二项总体中抽取包含n_{1}个观测值和n_{2}个观测值的独立样本,则两个样本比例差的抽样分布为:

\overline{P}_{1}-\overline{P}_{2}=\frac{X_{1}}{n_{1}}-\frac{X_{2}}{n_{2}}

具备以下性质:

  1. E(\overline{P}_{1}-\overline{P}_{2})=E(\overline{P}_{1})-E(\overline{P}_{2})=\pi _{1}-\pi _{2}
  2. D(\overline{P}_{1}\pm\overline{P}_{2})=D(\overline{P}_{1})+D(\overline{P}_{2})=\frac{\pi_{1} (1-\pi_{1})}{n_{1}}+\frac{\pi_{2} (1-\pi_{2})}{n_{2}}

\large \pi\large 1-\pi 不太小,而 \large n足够大,通常 \large n\pi\large n(1-\pi ) 均大于或等于5,\overline{P}_{1}-\overline{P}_{2}的抽样分布近似为正态分布,其均值和方差的公式如上。

  • 2
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
在Python中,可以使用概率论中的随机变量分布来进行统计计算。常见的离散型分布包括二项分布和泊松分布,连续性分布包括正态分布、均匀分布和指数分布等。这些分布可以用来计算概率、期望和方差等统计量。 对于正态分布,可以使用scipy.stats库中的norm模块进行计算。例如,可以使用norm.cdf函数计算小于某个值的概率,使用norm.ppf函数计算给定累积概率时的反函数值。代码示例如下: ``` from scipy.stats import norm # 计算小于40的概率 p1 = norm.cdf(40, loc=50, scale=10) # 计算30到40之间的概率 p2 = norm.cdf(40, loc=50, scale=10) - norm.cdf(30, loc=50, scale=10) # 计算小于2.5的概率 p3 = norm.cdf(2.5, 0, 1) # 计算-1.5到2之间的概率 p4 = norm.cdf(2) - norm.cdf(-1.5) # 计算累计概率为0.025时的反函数值 q1 = norm.ppf(0.025, loc=0, scale=1) # 计算累计概率为0.975时的反函数值 q2 = norm.ppf(0.975, 0, 1) print(p1, p2, p3, p4, q1, q2) ``` 对于计算随机变量的概率分布的均值和方差,可以使用numpy库进行计算。代码示例如下: ``` import numpy as np # 假设有一个数据框df,其中包含了不合格品数和概率 mymean = sum(df['不合格品数'] * df['概率']) # 计算均值 myvar = sum((df['不合格品数'] - mymean) ** 2 * df['概率']) # 计算方差 mystd = np.sqrt(myvar) # 计算标准差 print(mymean, myvar, mystd) ``` 以上是关于Python统计学中随机变量的概率分布的一些基本操作和计算方法。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [Python统计学03——随机变量的概率分布](https://blog.csdn.net/weixin_46277779/article/details/126673517)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

xia ge tou lia

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值