一个连续型变量数据是否符合正态分布,通常有以下两种情况:一种情况是数据本身整体的分布是否符合正态分布;另一种就是数据在某个分组上是否符合正态分布。
检验数据本身整体是否符合正态分布
下面是为了分析菌群α多样性指数Chao1,Shannon以及observed_otus指数在正常和模型组之间有无显著性差异,所以需要先分析Shannon这一列数据是否符合正态分布(图1)
![4bd55214c03371c09048e1e6075573c1.png](https://img-blog.csdnimg.cn/img_convert/4bd55214c03371c09048e1e6075573c1.png)
SPSS中的操作步骤:
①依次点击:“分析”-“非参数检验”-“旧对话框”-“单样本K-S”(图2),在弹出的对话框中,将“年龄”选入右侧栏中,并在下方“检验分布”中勾选“正态”(图3)选项。然后点击确定。
![daa3b82a793eafe51fb8f638109b3d9f.png](https://img-blog.csdnimg.cn/img_convert/daa3b82a793eafe51fb8f638109b3d9f.png)
②分析结果
从上方SPSS的输出结果可以看出:渐近显著性(双侧)为0.073大于0.05,意味着Shannon数据整体是符合正态分布的。
检验变量在某个分组上是否符合正态分布
![8cadfda7e7e3f0ddfe7de1e0d9b93767.png](https://img-blog.csdnimg.cn/img_convert/8cadfda7e7e3f0ddfe7de1e0d9b93767.png)
还是用上面的案例,如果要比较不同组别的Shannon是否有差异,这时候就需要检验Shannon在不同组别上是否符合正态分布。
操作步骤:
①依次点击:“分析”-“描述统计”-“探索”
![f38c228f8f7e8cf4ebabc5044c16a418.png](https://img-blog.csdnimg.cn/img_convert/f38c228f8f7e8cf4ebabc5044c16a418.png)
②在弹出的窗口中,将“Shannon”选入因变量列表,将“性别”选入“Group”列表
![23c56ee50cd6e0c03bc90df855fe5da6.png](https://img-blog.csdnimg.cn/img_convert/23c56ee50cd6e0c03bc90df855fe5da6.png)
③设置参数,点击右侧的“图”按钮,勾选“含检验的正态图”,点击继续,再点击确定。
![11c5e86df87e394c8e46f278b2516fc3.png](https://img-blog.csdnimg.cn/img_convert/11c5e86df87e394c8e46f278b2516fc3.png)
④结果分析,在结果界面点击左侧“正态性检验”标签,在右侧的正态性检验表中,看夏皮洛-威尔克那部分的显著性水平
![58bd1e8c4120b84ba924c724d0cd6905.png](https://img-blog.csdnimg.cn/img_convert/58bd1e8c4120b84ba924c724d0cd6905.png)
由上图可以看出1分组P>0.05,2分组P>0.05,这里注意了:当所有分组的P都大于0.05,就能说是符合正态分布,只要有一个分组的P小于0.05,就拒绝变量符合正态分布的结论。Shannon在分组上就符合正态分布了,所以就可以使用参数类的t检验,若不符合就使用非参数Mann-Whitney检验了。
独立样本t检验操作步骤:
①点击“分析”--“比较平均值”--“独立样本t检验”
![03dd7b603ec4940a4d4295692d1d59bd.png](https://img-blog.csdnimg.cn/img_convert/03dd7b603ec4940a4d4295692d1d59bd.png)
②将Shannon选入右侧检验变量,将Group选入分组变量
![86c178110acc03ccb220116850d673f1.png](https://img-blog.csdnimg.cn/img_convert/86c178110acc03ccb220116850d673f1.png)
③点击“定义组”,设置性别的分组编码,然后点击确定进行运算
![1c5feebf74b82554e4110d45b9352530.png](https://img-blog.csdnimg.cn/img_convert/1c5feebf74b82554e4110d45b9352530.png)
④结果分析
![028cd3eb6c5f33f92a67c07056cdaf44.png](https://img-blog.csdnimg.cn/img_convert/028cd3eb6c5f33f92a67c07056cdaf44.png)
基于来莱文方差等同性检验,如果方差齐,就选择第一行的T检验结果,如果方差不齐则接受第二行的T检验结果。这里判定方差齐性的标准为莱文方差等同性检验的显著性,基于本例为0.107>0.05,意味着原假设方差齐成立,接受假设方差齐。因此这里的T检验结果为:T=0.499,P=0.631>0.05。所以Shannon指数在正常与模型组之间没有显著性差异。
Mann-Whitney U 检验操作步骤:
Mann-Whitney U 检验是用得最广泛的两独立样本秩和检验方法。简单的说,该检验是与独立样本t检验相对应的方法,当正态分布、方差齐性等不能达到t检验的要求时,可以使用该检验。其假设基础是:若两个样本有差异,则他们的中心位置将不同。
为了分析菌群α多样性指数Chao1,Shannon以及observed_otus指数在正常和模型组之间有无显著性差异
SPSS数据视图:
![18a6b511910c29a6afc3abcfc8482b06.png](https://img-blog.csdnimg.cn/img_convert/18a6b511910c29a6afc3abcfc8482b06.png)
变量视图:
![13e3c3fb9f30b468def878a43b99be48.png](https://img-blog.csdnimg.cn/img_convert/13e3c3fb9f30b468def878a43b99be48.png)
进入菜单如下图:
![2de28d5aec1eeacac48137be82cd3dfd.png](https://img-blog.csdnimg.cn/img_convert/2de28d5aec1eeacac48137be82cd3dfd.png)
点击进入如下的界面,“目标”选项卡定制分析
![fff660309a40a47053901db7b73a5f12.png](https://img-blog.csdnimg.cn/img_convert/fff660309a40a47053901db7b73a5f12.png)
进入“字段”选项卡,将“Group”选入“检验字段”框,将“Chao1,Shannon和Observe-otus”选入“检验字段”框中。
![170498a45b6803adaadeb9d2df25a960.png](https://img-blog.csdnimg.cn/img_convert/170498a45b6803adaadeb9d2df25a960.png)
再进入“设置”选项卡,选中“定制检验”单选按钮,选择“Mann-Whitney U(二样本)”检验。点击“运行”即可。
![705d00643e20aba80529366b5067f27d.png](https://img-blog.csdnimg.cn/img_convert/705d00643e20aba80529366b5067f27d.png)
四、结果解读
这是输出的主要结果,零假设是“在Group类别上,Shannon等分布相同”,其P=0.690,0.548,0.421>0.05,故保留原假设,认为这三个指数在正常组与模型组之间没有统计学差异。
![7167ba2d82191f367eddbd8747238e02.png](https://img-blog.csdnimg.cn/img_convert/7167ba2d82191f367eddbd8747238e02.png)
参考来源:公众号:杏花开生物医药统计;王江源新浪博客;知乎:Alex
本人非数据分析科班出身,本文是在科研过程中自己的总结,希望会对你有用。