简介
回归分析是通过一定的数学表达式描述变量之间的数量变化关系,并进行预测。回归分析分为:一元线性回归分析,多元线性回归分析,非线性回归分析,曲线估计,时间序列的曲线估计等模型。回归分析和相关分析都是研究变量间关系的统计学分析方法,在回归分析中,变量Y成为因变量,自变量X可以是随机变量;而相关性分析中,X,Y都是随机变量。常见的回归分析方法有直线回归,多重线性回归,Logistic回归等。
回归模型的选用
- 直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则应作适当的变换,使其满足上述条件。
- 多重线性回归:
应变量(Y)为连续型变量(即计量资料),自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。
1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用。 - 二分类的Logistic回归:
应变量为二分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。
3.1、非配对的情况:用非条件Logistic回归
(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用
3.2、配对的情况:用条件Logistic回归
(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用。 - 有序多分类有序的Logistic回归:
应变量为有序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。
4.1、观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素
4.2、实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用。
回归分析举例
参考文献:
- Swanger, S. A, et al. Automated 4D analysis of dendritic spine morphology: applications to stimulus-induced spine remodeling and pharmacological rescue in a disease model[J]. Molecular Brain. (2011): 4:38-38.