统计量的概念:
不含任何未知参数的样本的函数。例如:
常见统计量:
例题引入:
甲厂向乙厂订购一批产品,要求次品率不得超过5%,现在抽取200个检查,发现9件次品,问甲方是否应该接受这批产品。
争议:乙厂,抽样结论为4.5%,合格。甲厂:抽样结果是随机的,有波动性。
假设:产品不合格率 P>=5%
分析:P的95%置信区间估计(按照如下方法) (0.0163,0.0737)。那么我们到底相信上限还是下限呢?
样本均值对总体均值的区间估计
其中
U检验中如何查U值表
需要计算U值表。
计算a/2=0.025。
计算1-0.025=0.975。
拿出标准正态分布表,查中间的概率百值找到0.975,此时竖向与百横向对应值分别是1.9和0.6,即:Z(1.96)=0.975。
所以说U值表的u0.025=1.96。
两类错误
若拒绝原假设,可能会“弃真”,犯第一类错误。
若接受原假设,可能会“取伪”,犯第二类错误。
检验原则:保护H0,(先提出有利于我的假设,除非有足够概率推翻,否则都接受)
原因(1):H0 很重要,关乎检验者的利益。
- 订货问题中,H0为产品不合格。
- 疑罪从无。
原因(2):弃真后果大于取伪后果。
- 肺炎患者检验,
数学描述:
注意:这里没有管二类风险,所以当我们接受H0的时候,H0还不成立的风险较大。“取伪”