今天听课听到这样一个结论:如果假设检验的样本量很大,那么显著性水平α应该设得小一点。
为什么呢?我没想通,于是去网上试图查找答案。结果发现网上很多人还在纠结:如果假设检验的样本量很大,那么会使假设检验的结果非常容易产生显著性。这是不是真的?样本量太大是不是不好?
我:??? 很久之前我就知道这种说法没有道理,但是我从来没有仔细去研究过这个问题。这次在知乎和stackexchange上搜罗了一下大家的回答,发现很多老师包括很多书上的说法都是错误的,在这里有必要澄清和记录一下。
首先,有些人之所以认为大样本会使假设检验结果更容易产生显著性,理由如下:
反对者说:这正说明了大样本的好处呀。如果样本量小,那么很可能假设检验的结果是由于偶然的原因导致的。样本量越大,我们越可以肯定假设检验的结果是准确的。
还有一种理由是这样的,以t检验为例,根据t值的计算公式:
,如果样本量n越大,标准误差就越小,这样t值就越大,也就可以推出p值越小,这不就说明样本量越大