1 H0与H1
Ho:空假设,维持现状
H1:可替换假设
1.1 举例说明
只看这个定义可能不太好理解H0和H1,我们举一个例子:
假设现有的疫苗有25%的概率提供两年的保护,然后我们假设新的疫苗有比老疫苗更好的保护有效率
那么在这种情况下,Ho是:'p=0.25',H1是:'p>0.25'
比如我们设置分界线为8
2 两种误差
无论我选择是否接受/拒接 Ho,都会带来一定的误差
下图的意思是,在分界线的左边,我们选择Ho;在分界线的右边,我们选择H1(两个曲线分别是Ho和H1的概率分布)
- 1类误差:拒绝Ho,但是实际上应该是Ho(也就是上图中红色的α区域)——>所以也被称为α-error 【level of significance】
- 2类误差:接受Ho,但是应该是H1(也就是上图中蓝色的β区域)——>所以也被称为β-error
很多情况下,α-error和β-error是一个此消彼长的过程,对于研发商来说,他们希望自己的产品被采纳得越多越好,所以他们希望更小的β-error;而对于老产品生产商来说,他们则希望更小的α-error
2.1 举例计算α-error和β-error
还是使用刚才的这个例子,我们来计算α-error和β-error:
而对于β-error,我们首先需要指定H1的特定的值(我们这里假定H1的p为0.5)
2.2 减少α-error
如果我们增大分界点(也就是分界线右移),那么可以在一定程度商,减少α-error
比如我们将分界线变成9:
这比分界线是8的时候的0.0409要小多了
2.3 减少β-error
如果我们扩大H1和Ho的距离,那么可与i在一定程度上减少β-error
比如我们现在让H1的p为0.7:
这比H1的p为0.5时候,0.2517的β-error要小很多!
2.4 同时减少α-error和β-error
在2.2和2.3小节中,我们不难发现,α-error和β-error在上面两个例子中,是此消彼长的,那么有什么办法可以同时减少这两个误差嘛
答案是有的:增大样本数量n
我们原来是20个样本,8个样本作为Ho和H1的分界线。现在我们等比例扩大,变成100个样本,40个样本作为Ho和H1的分界线
那么此时由于样本数大于30,我们可以用正态分布来近似这个分布了