T检验和U检验
统计学入门级的假设检验方法。T检验和U检验是正态分布的定量资料统计推断的常用方法,主要是用于两组资料的比较。
T检验有三种:配对T检验,成组T检验,样本均数和总体均数的T检验。
当样本含量较大时(如:n>60)或者总体的标准差已知时,我们可以选用U检验。
T检验的应用条件为:1.独立的随机样本 2.资料应当服从正态分布 3.方差齐性
举个例子:
正常成年男子血小板计数的均数为225×10°/L,今测得20名男性油漆作业工人的血小板计数值(10°/L):220,188,162,230,145,160,238,188,247,113,126,245,164,231,256183,190,158,224,175。问油漆作业工人的血小板计数与正常成年男子有无差异。
看到这道题,很明显是一个单样本的T检验:首先,20名男性油漆作业工人的血小板计数值相互独立。
我们应该选用哪种工具呢?
小朋友才做选择。
1.SPSS(简单、类似Excel无需编程)这里使用SPSS25
输入数据,点击分析。选择统计描述,点击探索。
将变量选进因变量列表,点击右侧图,并勾选含检验的正态图。点击继续->确定
得到结果,找到正态性检验的结果。查看显著性。两个显著性是一样的,看一个就可以了。比如我们看后面一个夏皮洛,显著性P=0.377>0.05,则我们认为没有显著性。认为该样本符合正态分布。
我们开始单样本T检验:点击分析->比较平均值->单样本T检验
将变量选入检验变量。填入题目所给出的总体均值225填入检验值中,点击确定。
查看结果。有一些基本的描述外,我们主要关注,SIG也就是显著性。此题中SIG=0.03<0.05,油漆作业工人的血小板计数与正常成年男子的血小板计数差异有统计学意义。
结论:油漆作业工人的血小板计数与正常成年男子有差异。
SPSS篇
没关系,后面还有Python篇,R语言,SAS。
来了,最接近人类语言的编程语言python
2.python
python,你对于编程是否感到被支配的恐惧呢?哈哈哈,以下内容并不适合小白,但希望我能尽我所能解释好。尽量使小白的你可以看懂。某:哎呦,我学过Python耶!!!恭喜你,你已经不用看这篇文章了。哭唧唧。。。本人也仅仅在Python入门的边缘而已。
言归正传:
我将使用Jupyter
show time!!!
b值为shapiro(夏皮洛)正态检验的W值以及P值,我们看P值。如SPSS中。
Ttest_1sampResult中我们关注pvalue,pvalue=0.0025164356418573572<0.05。油漆作业工人的血小板计数与正常成年男子的血小板计数差异有统计学意义。
Python是不是看起来很简单,哈哈哈,也就看起来很简单。这里使用了两个pandas、scipy。就两个库就有你学的了。Python确确实实很强大。个人人为R和python有多相似的地方。加油学吧!我也还在路上。
3.R语言篇
正统统计语言。R:我可以统计学家们的亲儿子
R:我就那么简单一个shapiro,一个t.test
看到这里的人,相信已经可以看出shapiro的意义了。废话不多说。直接看t.test。我们关注 P-value,<0.05。油漆作业工人的血小板计数与正常成年男子的血小板计数差异有统计学意义。
R是不是很简单?哈哈哈哈,往往看似简单的东西才让人抓狂。
4.SAS
来吧SAS!
没有SAS也是要编程的哦!!!小朋友是不是感觉SPSS很友好呢!我们点击一下那个会跑的小人。跑起来。。。
主要关注这两张表。先看正态性检验,再看位置检验student t。道理是一样的。
好了,额。。。要怎么写个结尾呢。额。。。。。
其实用什么工具都一样的,重要的还是统计的思想。这才是最值钱的。只不过是想为自己留下一些学习笔记。漏洞肯定有,因为我站得还不够高。我也还有很多东西要去学。python,R,我都正在自学中。如果这篇东西对你有用,那我也很开心,如果没用的话就不看吧!哈哈哈哈,你都看到这里了。如果有兴趣学习统计学方面的可以一起学习交流。欢迎留言。感谢!!!接下来我,应该还会更新一些新的统计方法。