前言
经过前面两天的学习,我们已经得到了每位被试标准化后的全脑体素灰质体积的图像,以及其全脑(TIV)等信息,可用作组间比较。具体流程可参考前文:
基于CAT的VBM和SBM计算学习笔记(一)VBM基于CAT的VBM和SBM计算学习笔记(二)感兴趣区(ROI)&全脑体积(TIV)
接下来我们就是要在统计上检验自己的假设,试图回答:该疾病组病人的灰质体积和健康组是否有差异?如果有差异,产生差异的在哪个脑区?
本文将介绍如何比较疾病组和对照组灰质体积差异的思路,统计原理,与技术方法。
统计分析思路
大脑皮层中,灰质(Grey Matter,GM)包含大量神经元。灰质体积异常是多种疾病的重要生物指标,比如阿尔兹海默病涉及大脑皮层和海马灰质的萎缩。
而标准化的VBM分析,让我们将每个被试的大脑灰质体积都映射到相同的空间和模版上,现在我们在跨组进行灰质体素体积的比较,现在统计分析就可以以每个体素为单位,计算统计量,疾病组和对照组之间的同一体素的差异就具有了可比性和可解释性。
但灰质体积的变化不仅受疾病影响,同样受到全脑体积、性别、年龄等因素影响,为了让比较有意义,我们需进行严格的协变量控制;并选择合适的阈值防止假阳性。
为了更好的检验我们关注的疾病和灰质体积之间的关联,笔者选择两步法分析:
- 识别差异:双样本T检验用于在全脑范围内识别疾病组和对照组存在灰质体积差异的脑区团块,定义为ROI。
- ROI和临床量表相关分析:进一步,针对疾病组的被试在差异脑区上的灰质体积和临床量表进行相关性分析,针对性的探索该ROI的改变是如何与疾病过程关联。
一、组间比较(独立样本T检验,t-test2)
1.原理
独立样本T检验用于比较两个不同组的平均值是否有显著差异。我们通过对每一个体素进行t检验,既可以在每一个体素单位内得到健康组和疾病组的差异t值。然后通过设置P值阈值(Threshold),以及连续多少个单位的激活(Cluster Size)的限制,既可以得到在统计学上存在显著差异的脑区。
- 该体素单位内健康组被试的灰质体积平均值。
- 该体素单位内疾病组被试的灰质体积平均值。
- 是健康组和疾病组该体素单位内灰质体积均值差异的标准误(Standard Error)。
2.技术
a.预处理
将两组灰质体积平滑(Smooth)后的.nii文件各存放在一个文件夹里。
将两组协变量(全脑体积(TIV)、性别、年龄、受教育水平)等分别存放在一个.txt文本里。
按照下图步骤放入Dpabi软件里进行运算。(Ps:两组灰质体积图像需要体素大小(VoxelSize)、维度(Dimension)都对齐。)
b.T值图
如果没有选择Permutation Test,DPABI这一步骤会输出两张.nii图像,分别涵盖了全脑每个体素单位的T值和效应量。
- "T2_"文件表示每个体素的T值。此处T值绝对值越大的脑区代表健康组和疾病组差距越大。T-Value我们要在后续转化为p值。
- T值的计算公式为:
% 绘制T值图像素值分布直方图
filepath = 'T2.nii';
info = niftiinfo(filepath);
data = niftiread(filepath);
figure;
histogram(data(:));
title('t值图像像素值分布直方图');
xlabel('像素值');
ylabel('频率');
用上诉代码在matlab中绘制t像素值分布图可以看出,正常的t值取值范围在-3到+3内。
c.效应量图
-
"T2_Cohen_f2"文件表示每个体素的效应量(effect size),使用的是Cohen's f²指标。(不是常见的d值,这里我最开始理解错误,导致误认为效应量很小。至于DPABI软件报告f值的原因,我看严超赣老师论坛的解释是没有特别原因,可以和Cohen's d进行转化。)
Effect size 的计算公式为: 。
,为决定系数。它表示自变量能解释因变量变异性的比例。
解释标准:
- 小效应:f = 0.1
- 中等效应:f = 0.25
- 大效应:f = 0.4
c.校准阈值
我选择GRF校正( ;;。)
详细教程可以参考:(DPABI分析图文教程)(DPABI统计分析视频教程)
接下来就可以把找到的Cluster提取出来,分析其疾病组和健康组存在差异的原因。
也可以将Cluster做成mask掩模,接下来用于提取感兴趣区,(提取ROI的原理与教程)。
总结
本文介绍了从cat12工具包提取出灰质体积后,进行组间比较的原理与思路,详细介绍了独立样本t检验的统计模型,以基于DPABI统计分析的步骤。从而得到了疾病组比健康组灰质体积显著减少的脑区,将其提取为ROI-mask,后续将和临床指标计算相关。