统计学从挂科到满分【笔记3】

第四章 专题:抽样估计

1. 抽样分布

分布:横坐标-样本值,纵坐标-出现概率
例子:某车间班组5个工人的时工资为34,38,42,46,50元,采用 重复抽样方法从5个工人中随机抽取2人构成样本。

抽取可能:
在这里插入图片描述
得到抽样分布图:
在这里插入图片描述
能计算出抽样期望:
在这里插入图片描述

1.1 抽样分布定理

正态分布的再生定理
若总体符合正态分布 X i − N ( E ( x ˉ ) , V a r ( x ) ) X_i-N(E(\bar x),Var(x)) XiN(E(xˉ),Var(x)),则样本均值也符合正态分布。

V a r ( x ) = m ( c = 2 ) = ∑ ( x i − x ˉ ) 2 / n = 方 差 = S 2 = 标 准 差 的 平 方 Var(x)=m_{(c=2)}=\sum (x_i-\bar x)^2/n=方差=S^2=标准差的平方 Var(x)=m(c=2)=(xixˉ)2/n==S2=
S为标准差
二阶中心动差即方差

V a r ( x ˉ ) = V a r ( x ) n = S 2 n ( 重 复 抽 样 ) Var(\bar x)=\frac{Var(x)}{n}=\frac{S^2}{n}(重复抽样) Var(xˉ)=nVar(x)=nS2
V a r ( x ˉ ) = V a r ( x ) n ( 1 − f ) = S 2 n ( 1 − f ) ( 不 重 复 抽 样 ) Var(\bar x)=\frac{Var(x)}{n}(1-f)=\frac{S^2}{n}(1-f)(不重复抽样) Var(xˉ)=nVar(x)(1f)=nS2(1f)

n为抽样数量, V a r ( x ˉ ) Var(\bar x) Var(xˉ)是抽样分布的方差

例题
某厂商产量数以亿计,声称其生产的产品具有均值为60个月,标准差为6个月的寿命分布。假设质检部门决定检验该厂的说法是否准确,为此随机抽取(不重复抽样)该厂生产的50件产品进行寿命试验。 请问:
(1)假定厂商声称是正确的,请描述50件产品的平均寿命的抽样分布;

(2)假定厂商声称是正确的,则50件产品组成的样本的平均寿命不超过57个月的概率是多少?


(1)

平均寿命的均值为60月;
平均寿命的方差= 6 2 50 \frac{6^2}{50} 5062=0.72,标准差约为0.85月;
即,平均寿命服从均值60月,方差0.72的正态分布。

(2)
P ( X ˉ ≤ 57 ) = P ( X ˉ − 60 0.85 ≤ 57 − 60 0.85 ) = P ( Z ≤ − 3.529 ) = 1 − P ( Z ≤ 3.529 ) = 1 − 0.998 = 0.0002 P(\bar X\leq57)=P(\frac{\bar X-60}{0.85}\leq\frac{57-60}{0.85})=P(Z\leq-3.529)\\=1-P(Z\leq3.529)\\=1-0.998=0.0002 P(Xˉ57)=P(0.85Xˉ600.855760)=P(Z3.529)=1P(Z3.529)=10.998=0.0002

2. 抽样误差

2.1 抽样标准误

抽样分布的标准差我们一般也叫抽样标准误,记作 S e ( x ˉ ) Se(\bar x) Se(xˉ)

2.2 抽样极限误差

以样本统计量估计总体参数时所允许的最大误差范围 Δ \Delta Δ

概率度 Z α / 2 Z_{\alpha/2} Zα/2
置信水平 1 − α 1-\alpha 1α
反映的是极限误差的相对程度
在这里插入图片描述
有公式:
Δ = Z α / 2 ∗ S e ( x ˉ ) \Delta=Z_{\alpha/2}*Se(\bar x) Δ=Zα/2Se(xˉ)

3. 区间估计

区间估计是用一个具有一定可靠程度的区间范围来估计总体参数。
区间估计的两个基本要求是置信度和精确度。
区间越大,覆盖总体参数值的可能性越高,但其精确度越低。

区间估计步骤:

  • 第一步:根据样本数据计算 S e ( x ˉ ) Se(\bar x) Se(xˉ)
  • 第二步:给定置信水平 1- α \alpha α,计算出 Z a / 2 Z_{a/2} Za/2
  • 第三步:计算出总体均值的估计区间 Δ \Delta Δ

例题
某企业生产某种产品的工人有1000人,某日采用不重复抽样从中随机抽取100人调查他们的当日产量。要求在95%概率保证程度下,估计该厂全部工人的人均日产量。

在这里插入图片描述
解:
f i f_i fi是各项占比, f f f是样本占总的比
第一步:计算抽样标准误差
x ˉ = ∑ x i f i ∑ f i = 116 ∗ 7 + 120 ∗ 18 + . . . + 140 ∗ 4 100 = 126 件 \bar x=\frac{\sum x_if_i}{\sum f_i}=\frac{116*7+120*18+...+140*4}{100}=126件 xˉ=fixifi=1001167+12018+...+1404=126
s = ∑ ( x i − x ˉ ) 2 f i ∑ f i − 1 = 6.47 件 s=\sqrt{\frac{\sum(x_i-\bar x)^2f_i}{\sum f_i-1}}=6.47件 s=fi1(xixˉ)2fi =6.47

S e ( x ˉ ) = s 2 n ( 1 − f ) = 6.4 7 2 100 ( 1 − 100 1000 ) = 0.614 件 Se(\bar x)=\sqrt{\frac{s^2}{n}(1-f)}=\sqrt{\frac{6.47^2}{100}(1-\frac{100}{1000})}=0.614件 Se(xˉ)=ns2(1f) =1006.472(11000100) =0.614

第二步:计算抽样极限误差

第五章 假设检验

事先对总体参数或者总体分布做出某种假设,利用样本信息来判断假设是否成立。

1. 假设验证的原理

小概率原理
我们引入一个概念:显著性水平 α \alpha α
α ≤ 0.05 \alpha\leq0.05 α0.05则我们则称之为小概率

反证法
基于假设计算样本结果的可能性,观察显著性水平。

假设验证的步骤
提出假设-构建验证统计量-确定拒绝域-做出决策

例子

  • 【总体】:已知去年新生婴儿的平均体重为3190g,标准差为 80。
  • 【问题】:今年的新生婴儿与去年相比,体重有无显著差异?
  • 【样本】:随机抽取100人,测得平均体重为3210g。

解决

  • 第一步:提出假设
    原假设: W n o w = W l a s t = 3190 g W_{now}=W_{last}=3190g Wnow=Wlast=3190g
    备择假设: W n o w ≠ W l a s t W_{now}\neq W_{last} Wnow=Wlast
  • 第二步:构建检验统计量:
    标准离差:
    (标准离差表示样本数据的离散程度)
    z = x ˉ − μ 0 S / n = 3210 − 3190 80 / 100 = 2.5 z=\frac{\bar x-\mu_0}{S/\sqrt{n}}=\frac{3210-3190}{80/\sqrt{100}}=2.5 z=S/n xˉμ0=80/100 32103190=2.5
  • 第三步:确定拒绝域
    在这里插入图片描述
    所以,有显著差异

2. 单个总体均值的检验

我们研究的问题:
在这里插入图片描述

2.1 检验统计量的选择

我们一般使用标准离差作为检验统计量
在这里插入图片描述
例子
某批发商欲从厂家购进一批灯泡,根据合同规定,灯泡的使用寿命平均不能低于1000小时。已知灯泡使用寿命服从正态分布,标准差为20小时。在总体中随机抽取100只灯泡, 测得样本均值为960小时。批发商是否应该购买这批灯泡? ( α \alpha α=0.05)

  • 第一步:提出原假设与备择假设
    H 0 : μ > = 1000   H 1 : μ < 1000 H_0:\mu >=1000\space H_1:\mu<1000 H0:μ>=1000 H1:μ<1000
  • 第二步:构建检验统计量
    z = 960 − 1000 20 100 = − 2 z=\frac{960-1000}{20\sqrt{100}}=-2 z=20100 9601000=2
  • 第三步:确定拒绝域:
    因为 α = 0.05 \alpha=0.05 α=0.05
    在这里插入图片描述
    因为z=-2,存在证据表明该批灯泡的寿命低于1000小时

3. 两个总体均值的检验

我们研究的问题:
在这里插入图片描述
检验统计量:
z = ( x ˉ 1 − x ˉ 2 ) − ( μ 1 − μ 2 ) s 1 2 n 1 + s 2 2 n 2 z=\frac{(\bar x_1-\bar x_2)-(\mu_1-\mu_2)}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}} z=n1s12+n2s22 (xˉ1xˉ2)(μ1μ2)~N(0,1)

例题
根据历史资料得知,A、B两种机器生产出的弹簧其抗拉强度的标准差分别为8公斤和10公斤。从两种机器生产的产品中各抽取一个随机样本,样本容量分别为 n 1 n_1 n1=32, n 2 n_2 n2=40,测得两个样本的均值分别为50和44公斤。问这两种机器生产的弹簧,平均抗拉强度是否有显著差别? ( α \alpha α= 0.05)

  • 第一步:提出假设与备择假设
    H 0 : μ 1 − μ 2 = 0   H 1 : μ 1 − μ 2 ≠ 0 H_0:\mu_1-\mu_2=0\space H_1:\mu_1-\mu_2\neq0 H0:μ1μ2=0 H1:μ1μ2=0
  • 第二步:构建检验统计量
    z = ( 50 − 40 ) − 0 64 / 32 + 100 / 40 = 2.83 z=\frac{(50-40)-0}{\sqrt{64/32+100/40}}=2.83 z=64/32+100/40 (5040)0=2.83
  • 第三步:确定拒绝域:
    在这里插入图片描述
    所以,具有显著性差异
关于 t 检验

也就是我们的检验统计量
在这里插入图片描述
在这里插入图片描述
例题:欲研究A、B两种方法组装某种产品所用的时间是否 相同。选取部分工人进行抽样分析。已知用两种工艺组装产 品所用时间服从正态分布,且 s 1 s_1 s1 s 2 s_2 s2 。试问能否认为B方 法比A方法组装更好?( α \alpha α= 0.05)

在这里插入图片描述

  • 第一步:提出原假设和备择假设
    H 0 : μ 1 − μ 2 ≤ 0   H 1 : μ 1 − μ 2 > 0 H_0:\mu_1-\mu_2\leq0\space H_1:\mu_1-\mu_2>0 H0:μ1μ20 H1:μ1μ2>0
  • 第二步:构造检验统计量
    在这里插入图片描述
  • 第三步:确定拒绝域
    在这里插入图片描述
  • 2
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
统计学:从数据到结论》是一本介绍统计学基本概念和应用的教材或专业书籍。统计学是研究如何收集、整理、分析和解释数据的学科,它在各个领域都有广泛的应用。 这本书主要包含以下内容: 1. 数据收集:介绍了不同的数据收集方法,如调查问卷、实验设计和抽样调查等。它会讲解如何设计合适的实验或调查,以及如何确保数据的准确性和可靠性。 2. 数据整理与总结:介绍了数据整理和数据总结的基本方法,包括数据的分类、统计描述和数据可视化等。通过数据整理和总结,可以更直观地理解数据的特征和规律。 3. 统计推断:介绍了统计推断的概念和方法,包括参数估计和假设检验等。统计推断可以帮助我们从样本中推断总体的特征,并对统计推断结果的可靠性进行评估。 4. 数据分析与模型建立:介绍了常见的数据分析方法,如回归分析、方差分析和聚类分析等。这些方法可以帮助我们发现数据背后的关联和规律,并建立相应的数学模型。 5. 统计结论:最后一部分介绍了如何根据统计分析的结果得出科学的结论,并对结论的可靠性进行评估。同时,还会讨论一些常见的误解和统计陷阱,帮助读者正确应用统计学方法。 通过学习《统计学:从数据到结论》这本书,读者可以了解统计学的基本原理和方法,培养数据分析和推理的能力。这对于从事科学研究、市场调研、医学和社会科学等领域的人员都非常有帮助。同时,这本书也是学习统计学的入门教材,适合初学者使用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值