![2e26ad4470381a656ad97ecf9bd2f7d9.gif](https://i-blog.csdnimg.cn/blog_migrate/bb232c0e7239b79c93b012d3914d409c.gif)
1.什么是z检验(z-test)和t检验(t-test)?
在CFA数量里面我们会涉及到用统计学来估测一个总体的平均值是多少,比如我们想知道CFA持证人的平均收入是怎么样的,那么我们就会做一些抽样调查。
但是,抽样调查未必靠谱,抛开因为操作失误存在的偏差以外,在概率上来说我们依然完全有可能是不小心统计了并不反映事实的一部分人。比如说,我们相信CFA持证人的平均工资是100k,我们想要通过抽样调查找50个持证人的平均收入来证明我们是正确的。但是结果说来也是太巧合了,我们刚好不小心统计收入最低的那50个人,于是我们会误以为持证人的平均工资的确没有100k。虽然这种事情发生的概率很小,但是却不得不承认我们确实有可能会遇到这种情况。那么z检验和t检验就是检验我们出现这种情况的概率是怎么样的
2.那么具体的z检验和t检验是什么含义?
z检验和t检验实际上是给我们一个这么一个安全区间,我们可以有一个大致的置信区间,比如统计学方面我们可以算出来,一个95%的概率不会出错的情况下,我们应该预留的空间是多少.比如我们通过样本测算出来CFA持证人的平均工资是100k,那么假设这个样本的采样是足够随机的话,实际上是我们可以通过样本的方差算出来一个95%不会出错的容错区间是多少。
![c3e91c76b300aa6b3d2826ba943b57a0.png](https://i-blog.csdnimg.cn/blog_migrate/6fcb67a1ecc0d8477e42006a3376978d.jpeg)
实际上,我们可以通过t检验来计算我们的抽样是否能证明我们的假设(平均收入100k),如果样本是符合正态分布(normal distribution)的数据还可以通过z检验(在样本量超过50的话两者会得出相似的结果)。依照t检验(或者z检验),我们得出的容错区间是1.96倍标准误差(standard error)。标准误差可以通过样本的方差算出来的。那么假如标准误差是20k,那么我们的容错区间量大约就是40k了,也就是说我们有95%的概率可以相信实际CFA持证人的实际平均工资是在60k到140k之间。
此时z检验和t检验就是用来检测,我们通过样本计算出来的平均值,偏离我们估计的平均值(100k)有几倍的标准误差。如果t是3(也就是说我们样本统计的结果是160k),那么意味着我们的样本实际上是偏离了估计值3倍的标准误差
3. 我们应该选择z检验还是t检验?
取决于两点:
- 样本是否足够大(大于30)
- 样本是否符合正态分布 (normal distribution)
![a1e3912bf61cbe8f44f7d5f27b4c7f2a.png](https://i-blog.csdnimg.cn/blog_migrate/be919e1a2f4f90eb23ef0dfc2f71cf12.jpeg)