参数估计:总体参数如U ,π
原理:从总体中抽样为n的样本,K次(大量次数如1000)可得到K个样本,分别计其平均数X拔,故可得到1000个X拔,将其画为频数分布直方图——可以得到其服从正态分布直方图
计算X拔的平均数,可以得出X拔的平均数≈u
同时X拔标准差(标准误)=σ/根号n。
综上:可知样本值为集中在U的正态分布
当样本值越接近U其代表总体能力越好,也可推断出当样本值越接近U时来自该总体可能性也就越大。
在正态检验,t检验,方差分析,X2卡方检验
中通过不同公式,将样本值转换为标准相应分布。①建立假设 ②计算统计量 :公式变换为相应的标准分布 ③P:也就是看样本与总体距离。当样本离总体越近出自该总体可能性阅读量,P越大。当样本离总体越远出自该总体可能性阅读量,P越小。P跃小说明其来自该总体可能性越小。当P<a=0.05,一般认为是小概率事件,则说明一次抽样获得该样本值不太可能发生。故拒绝H。反之亦然。
非参数估计:总体分布位置,中位数检验
从总体中抽样为n的样本,K次(大量次数如1000)可得到K个样本,分别计其中位数,故可得到1000个样本中位数,将其画为频数分布直方图——可以得到其服从正态分布直方图
计算样本中位数的中位数,可以得出样本中位数集中分布总体中位数附近。
同参数估计:样本中位数集中于总体中位数分布,故离总体中位数越近则其来自该总体可能性越大。
(个人理解)秩和检验,即利用秩序之和代替了原有的中位数,可以理解为代替后秩序之和在总体秩和附近波动(同上中位数,均数)
故在T界值表(秩和表中)
n=8为例
5—31(双侧0.1) 3—33(双侧0.05)
1—35(双侧0.02) 0—36(双侧0.01
当求得秩和T在3—33内,则其P>0.05
此处双侧0.05指的为双侧尾部面积与a/2类似
故T界值表两段值可以看为对应a值下的Ua/2值
(即如正态分布中双侧尾部面积a/2=0.05,我们需查表得出对应Z0.05/2=1.96,在T表则是给出)
综上个人总结理解,欢迎讨论。个人总得观点
1从总体中抽取大量样本后,可以得到样本值集中于总体值的分布。
2当样本值离总体值越近时,代表性越好,参数估计越好。(置信区间)
3当样本值离总体近时,该样本出自该总体可能性越大,也就是P越大。