统计学6——统计量及其抽样分布

目录

知识结构

内容精读

1.常用统计量

2.重要分布

3.中心极限定理

名词解释 

小结


知识结构

内容精读

1.常用统计量

在第一节我们知道统计量是样本的概括性数字度量。下面列举一些常见的统计量:

(1)样本均值

$$\bar{X}=\frac{1}{n}\sum_{i=1}^{n}X_{i}$$

对于$\bar{X}$一般有$E(\bar{X})=E(X)=\mu$,$D(\bar{X})=\frac{1}{n}DX=\frac{\sigma^2}{n}$。

(2)样本方差

$$S^2=\frac{1}{n-1}\sum_{i=1}^{n}(X_{i}-\bar{X})^2$$

样本方差与总体方差之间存在$E(S^2)=DX=\sigma^2$。

(3)样本变异系数

$$V=S/\bar{X}$$

反映了总体变异系数C的信息,消除了均值不同对不同总体的离散程度的影响,因此也常用来刻画均值不同时总体的离散程度。

(4)样本k阶矩

$$m_{k}=\frac{1}{n}\sum_{i=1}^{n}X_{i}^{k}$$

显然$m_{1}=\bar{X}$。

(5)样本k阶中心矩

$$v_{k}=\frac{1}{n-1}\sum_{i=1}^{n}(X_{i}-\bar{X})^k$$

同样$v_{2}=S^2$。

(6)偏度

$$\alpha_{3}=\sqrt{n-1}\sum_{i=1}^{n}(X_{i}-\bar{X})^3/(\sum_{i=1}^{n}(X_{i}-bar{X})^2)^{3/2}$$

反应了随机变量密度函数曲线在众数两边的偏斜性。如果X服从正态分布,则偏度为0。

(7)峰度

$$\alpha_{4}=(n-1)\sum_{i=1}^{n}(X_{i}-\bar{X})^4/(\sum_{i=1}^{n}(X_{i}-bar{X})^2)^{2}-3$$

反应密度函数曲线在众数附近峰的尖峭程度,同样若X服从正态分布,峰度为0。

2.重要分布

抽样分布、参数估计、假设检验被看做统计推断的三个中心内容。其中抽样分布中$\chi^{2}$分布、t分布、F分布又被称作统计三大分布。

2.1$\chi^{2}$分布

定义:对于随机变量$X_{1},X_{2},……,X_{n}$相互独立,且均服从标准正态分布。则它们的平方和服从自由度为n的$\chi^{2}$分布。

卡方分布的概率密度曲线如下:

对于该分布有如下几个特征:

  • $E(\chi^2)=n$
  • $D(\chi^2)=2n$
  • $\chi^2_{1}+\chi^2_{2}~\chi^2(n_{1}+n_{2})$

ps:

当自由度n很大时,$\sqrt{2\chi^2(n)}$近似服从$N(\sqrt{2n-1},1)$ 。

2.2t分布

定义:随机变量$X~N(0,1),Y~\chi^2(n)$。且X,Y相互独立。

则$t=\frac{X}{\sqrt{Y/n}}$服从t分布,记t(n)。

t分布的密度函数是一个偶函数,其图像入下:

特别的当$n\geqslant 2$时,$E(t)=0$,

当$n\geqslant 3$时,$D(t)=\frac{n}{n-2}$。

ps:

$$\frac{\sqrt{n}(\bar{X}-\mu)}{S}~t(n-1)$$

$$\frac{(\bar{X}-\bar{Y})-(\mu_{1}-\mu_{2})}{S_{xy}}\sqrt{\frac{mn}{m+n}}~t(n+m-2)$$

其中$S_{xy}^2=\frac{(n-1)S_{x}^2+(m-1)S_{y^2}}{n+m-2}$

2.3F分布

定义:有随机变量Y,Z相互独立,且Y和Z分别服从自由度为m和n的$\chi^2$分布。

则有$X=\frac{Y/m}{Z/n}~F(m,n)$,其中m为第一自由度,n为第二自由度。

密度函数曲线如下:

$$E(X)=\frac{n}{n-2},           n>2$$

$$D(X)=\frac{2n^2(m+n-2)}{m(n-2)(n-4)},     n>4$$

且有$F_{p}(v_{1},v_{2})=\frac{1}{F_{1-p}(v_{2},v_{1})}$。

3.中心极限定理

从均值为$\mu$、方差为$\sigma^2$的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值$\bar{X}$的抽样分布近似服从均值为$\mu$、方差为$\frac{\sigma^2}{n}$的正态分布。

ps:

根据经验当$n\geqslant 30$时可认为是大样本,否则为小样本。

名词解释 

样本统计量

设X,X2,…,Xn是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数T(X,X2,…,X),不依赖于任何未知参数,则称函数T(X,X,…,Xn)是一个统计量。通常,又称T(X1,X2, …,Xn)为样本统计量。 

次序统计量

设X,X2,…,Xn是从总体X中抽取的容量为n的一个样本,Xo称为第i个次序统计量,它是样本X,X2,…,Xn满足如下条件的函数:每当样本得到一组观测值x,X2, …,x,时,其由小到大的排序x 10sx(2)≤…≤X() ≤…≤X(n)中,第i个值xc就作为次序统计量X的观测值,而X(1, , X(2),…,X(n)称为次序统计量。其中,X,和X(n分别为最小和最大次序统计量。

 充分统计量

在统计学中,假如一个统计量能把含有样本中有关总体的信息一点都不损失地提取出来,那对保证后边的统计推断质量具有重要意义。统计量加工过程中一点信息都不损失的统计量称为充分统计量。

抽样分布

抽样分布是指在重复抽样中由样本统计量所形成的分布,是一种理论分布。统计量是样本的函数由于样本是随机抽取的,而对于每一个样本,统计量都有一个相应的值,因此统计量也是一个随机变量。根据样本计算出统计量所有可能值的分布,则得到一个抽样分布。

每一个统计量来自于容量相同的所有可能样本,它提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据。

小结

统计量是统计学的基础,后续的参数估计与假设检验都是在此基础上进行。 

  • 19
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在Python中,可以使用概率论中的随机变分布来进行统计计算。常见的离散型分布包括二项分布和泊松分布,连续性分布包括正态分布、均匀分布和指数分布等。这些分布可以用来计算概率、期望和方差等统计。 对于正态分布,可以使用scipy.stats库中的norm模块进行计算。例如,可以使用norm.cdf函数计算小于某个值的概率,使用norm.ppf函数计算给定累积概率时的反函数值。代码示例如下: ``` from scipy.stats import norm # 计算小于40的概率 p1 = norm.cdf(40, loc=50, scale=10) # 计算30到40之间的概率 p2 = norm.cdf(40, loc=50, scale=10) - norm.cdf(30, loc=50, scale=10) # 计算小于2.5的概率 p3 = norm.cdf(2.5, 0, 1) # 计算-1.5到2之间的概率 p4 = norm.cdf(2) - norm.cdf(-1.5) # 计算累计概率为0.025时的反函数值 q1 = norm.ppf(0.025, loc=0, scale=1) # 计算累计概率为0.975时的反函数值 q2 = norm.ppf(0.975, 0, 1) print(p1, p2, p3, p4, q1, q2) ``` 对于计算随机变的概率分布的均值和方差,可以使用numpy库进行计算。代码示例如下: ``` import numpy as np # 假设有一个数据框df,其中包含了不合格品数和概率 mymean = sum(df['不合格品数'] * df['概率']) # 计算均值 myvar = sum((df['不合格品数'] - mymean) ** 2 * df['概率']) # 计算方差 mystd = np.sqrt(myvar) # 计算标准差 print(mymean, myvar, mystd) ``` 以上是关于Python统计学中随机变的概率分布的一些基本操作和计算方法。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [Python统计学03——随机变的概率分布](https://blog.csdn.net/weixin_46277779/article/details/126673517)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值