假设检验 - 区间估计(总体标准差未知)

背景知识:

u分布:指标准正态分布,是以0为平均值,以1为标准差的正态分布

z分布:泛指正态分布,是以u为平均值,以西格玛为标准差的正态分布。对于z分布中的所有变量X,转换为(X-U)/西格玛时,其服从u分布。即标准正态分布。

t分布:t分布的均值为0

(参考链接):https://www.applysquare.com/topic-cn/TZVQpbknE/

1》t分布是正态分布的小样本形态,小样本的标准通常是n=30或n=50,随着样本量的增大,t分布逐渐逼近正态分布。由此可见,z分布通常用于大样本,t分布通常用于小样本,但由于t分布具有逐渐逼近正态分布的特征,使得它也可以应用于大样本。所以方便起见,在已知样本总体服从正态分布的情况下,你可以不管样本大小一律使用t分布而不用z分布。

2》t分布是z分布的小样本分布,即当总体符合z分布时,从总体中抽取的小样本符合t分布,而对于符合t分布的变量,当样本量增大时,变量数据逐渐向z分布趋近

z检验和t检验都是均值差异检验方法,其实由于t分布逐渐逼近z分布的特点,t检验的运用要比z检验更广泛,因为大小样本时都可以用t检验,而小样本时z检验就不太适用了。

z检验适用于变量符合z分布的情况,而t检验适用于变量符合t分布的情况。

3》当整体标准差已知的时候,就不需要用样本标准差去估计总体标准差了。所以都用z检验。

而当总体标准差未知的时候,则需要估计,用t检验。当n大于等于30,z检验和t检验结果相近,以t检验为准。但是z检验比较好计算,就在大样本时替代t。

4》

z检验和t检验都是均值差异检验方法,其实由于t分布逐渐逼近z分布的特点,t检验的运用要比z检验更广泛,因为大小样本时都可以用t检验,而小样本时z检验就不太适用了。具体来说的话,如果总体方差已知,那就可以直接计算。如果总体方差未知,那就只好用样本方差来代替总体方差进行计算。但是,数理统计学家已经证明,样本方差总是略小于总体方差的,那么用样本方差来代替总体方差进行计算就会带来系统误差。在平均数抽样分布中,为了平衡这个系统误差,人们提出了t分布。当样本很大的时候,t分布就接近正态分布;或者说,t分布的极限就是正态分布。

至于t分布是怎么来的,数学家有一套严谨而庞杂的推导过程和证明过程。如果你是数学系的博士,你可以找数学家的推导过程和证明过程来看一看。如果你是心理学考研人,你还是别深究了吧,记住结论就行。

 (顺便说一句,用样本方差来推断总体方差的时候,要用n-1来算,也是出于同样的原因。样本不是我们的研究对象,研究样本是为了推断总体,切记。)

========================================================

已知:

样本容量n=200

样本标准差s=2

样本均值=7.5

未知:总体标准差σ

求:总体均值的区间估计

------------------------------------------------------------------------------------------------------

【由于在实际工作中,往往σ是未知的,常用s作为σ的估计值,为了与u变换区别,称为t变换,统计量t 值的分布称为t分布。 - 百度百科】

解答如下:

通过样本标准差s 估计 总体标准差 (西格玛),总体均值是以t分布的概率分布为依据。

--》t分布假设抽样总体满足正态分布(z分布),但是非正态分布中,也是能用t的,效果不错(有点迷惑)

---->t分布曲线形态与n(样本容量)(确切地说与自由度df)大小有关。与标准正态分布曲线相比,自由度df越小,t分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度df愈大,t分布曲线愈接近正态分布曲线,当自由度df=∞时,t分布曲线为标准正态分布曲线。

.-------》相关公式

区间估计公式

自由度=n(样本容量)-1

样本标准差

边际误差

----------------------》公式没有太大的变化,总体标准差 σ变为样本标准差s,置信水平由t概率表计算。

t概率的区间分布,需要自由度(n-1)和置信水平(1-a)两个参数,

----》案例中,自由度df=n-1=200-1=199

假设置信水平=1-a=95%时,那么代入区间估计公式后=7.5士t0.025*(2/根号200)

方法1:使用excel函数公式

----->如何求t0.025(199)?可以使用TINV函数求得:TINV(probability,degree of freedom)=TINV(0.05,199)=1.97

该函数中probability=a=1-0.95=0.05

------>最后结果=7.5士1.97*0.01=【7.22,7.77】

方法2:想通过查T分布表获得Z值(有待研究)

---------------------------------------------------------------------------------------

t a/2表示:自由度为n-1时,使t分布的右侧面积为a/2时t的值。

t值与z值一个意思,但z一般用于正态分布;使用函数TINV,返回的是是t分布上的分布点。

--------------------------------------

分位数的概念:(来自于百度)https://iask.sina.com.cn/b/gWFdrSVWChrl.html

1》

P(X>A)=α,则数A称为X所服从的概率分布的上α分位点。
例如t~t(n-1),使P(t>T)=α的数T称为t(n-1)分布的上α分位点。
t分布的密度函数是关于y轴对称的,因此对任实数a>0,P(t>a)=P(ta)=2P(t>a).
现在看到的t分布表制作有这样两种:
(1)列出的是使P(t>T)=α的T的值,将T记作t(α)(自由度不写了);
(2)列出的是使P(|t|>T)=α的T的值,将T记作t(α).
在(1)表格中查到的t(α/2)与在(2)表格中查到的t(α)是同一个数,都是这个t分布的上α/2分位点。

 

 

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
©️2022 CSDN 皮肤主题:大白 设计师:CSDN官方博客 返回首页

打赏作者

数据分析大大白

你的鼓励将是我创作的最大动力

¥2 ¥4 ¥6 ¥10 ¥20
输入1-500的整数
余额支付 (余额:-- )
扫码支付
扫码支付:¥2
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值