T检验的应用条件是:
总体分布已知且为正态分布
在此补一个对正态分布本质的探讨。
现实过程中的离散分布,如果是随机二项分布的话,都会近似正态分布,举几个栗子:
1. 抛10次硬币,出现2次正面朝上的分布(要么朝上,要么朝下)
2. 找100个男人,假设平均身高180,身高的分布(每个人身高和均值的变化都是各种随机变量引起的,从而体现出随机性,故长不长都是50%)
3. 一份英语选择题试卷,蒙题然后得分的分布(对不对都是等概率事件)
4. 生产一个口径为100cm的大炮,最后实际的口径(随机性的误差,正负50%)
…
可以说,自然情况的正态分布的前提就是“随机”,在均值的上下,发生一件事情是随机的,那么不发生一件事情也是随机的,所以在很多次试验后就会体现出抛硬币的属性。
统计学有一个非常简单的定律:大数定律
也就是说,均匀的硬币,我们知道正反面出现的概率相等,但是扔一次,可能出现正面或反面,根本就是在【0,1】两个极端摇摆,但是我抛5次,可能出现2次正面,3次下面,如果我抛1000次,可能就接近500次了,这个很好理解。
那么,所谓的事情发生的概率,不过就是多次实验的结果
由此推论,在出现实验结果之前,我们是永远不会知道事物的真实概率
这个也很好理解