回归分析(regression analysis )是研究一个变量如何随另一个或一些变量变化的方法。例如,学习成绩会受努力的时间,方法,个人的智慧,教育资源等因素影响;疾病的发生与生活环境,方式,遗传因素,自身体质等影响。常见的回归分析有线性回归、非线性回归、多重线性回归、Logistic回归、Probit回归分析等等。本节主要讲解简单线性回归,即研究变量Y随变量X变化的分析,不考虑多个自变量对结果变量的情况。
线性回归(linear regression )是分析两个定量变量间的线性关系。一般地,某一变量(称为Y变量)随另一变量(X变量)变化而变化,且这种变化趋势呈直线趋势。
☞☞【简单线性回归(一)】
☞☞【简单线性回归(二)】
线性回归模型的适用条件
简称(LINE) (1)线性(linear)因变量y与自变量x呈线性关系,通过绘制散点图,大致判断是否满足线性关系。
(2)独立性(independence)每个个体观察值之间相互独立,即任意两个观察值之间不应该有关联。
(3)正态分布(normal distribution)因变量y服从正态分布。即在一定范围内,任意给定X值,其对应的随机变量Y均服从正态分布。一般可以通过残差的散点图来判断;如果不满足正态性,可采用数据变换的方式使其满足正态性。
(4)方差齐性(equal variance)在一定范围内,不同的X值所对应的随机变量Y的方差相等。通过残差图判断是否等方差性。
回归分析的应用
(Ⅰ)描述变量间的依存关系 (Ⅱ)利用回归方程进行预测 (Ⅲ)利用回归方程进行统计控制线性相关与回归的区别及联系 最小二乘法原则通俗地讲, 通过样本数据(X、Y)的散点图,尽可能地让所有的散点与某条直线的距离“最近”,来拟合出最好的一条直线。
回归分析的一般步骤
案例分析 某医师测量了15名正常成年人的体重(Kg)与(CT)双肾总体积(ml)大小,数据下表所示。( 数据来源:医学统计学第4版,点击数据视图
手把手教你(Ⅰ)作散点图
散点图如下:体重和双肾总体积大致呈线性趋势;(Ⅱ)正态性检验
【方法】 ☞☞ 判断是否服从正态分布的几种方法 常见的有Q-Q图、P-P图、S-W检验; 正态性检验结果: 体重(p=0.865>0.05),双肾总体积(p=0.528>0.05)表明均服从正态分布。(Ⅲ)相关系数
【方法】 ☞☞ 线性相关
由于两变量均服从正态分布,故可计算两者的Pearson相关系数(Ⅳ)方差齐性检验
通过残差分布深入了解实际资料是否符合等方差性。 一般作标准化残差图,即以标准化残差为纵坐标,因变量为横坐标。当标准化残差图中散点的分布,绝大部分在±2倍标准差之间,在以0参考线的上下随机且均匀地散布时,可以认为模型数据拟合得较好。详细残差图见结果分析(V)。(Ⅴ)线性回归模型构建
(i)单击“statistics”
(ii)单击“Plots” 验证是否满足等方差性 结果解析(Ⅰ)描述性统计和相关系数
双肾总体积(266.10±38.05)与体重(59.53±13.51)之间的Pearson相关系数为0.875(p<0.001)。
(Ⅱ)模型摘要
调整R方值是衡量估计的模型对观测值的拟合程度的统计量,Adujusted R square 为0.748,可以认为该模型拟合较好。
Durbin-Watson(U),即模型残差独立性检验,其值在0~4之间,等于2时,则独立性最好。
(Ⅲ)总体回归系数β的统计推断——回归方差分析
结果显示,F=42.646,p <0.001,按α=0.05的检验水准,差异有统计学差异,即体重与双肾总体积有线性回归关系。
(Ⅳ)回归系数
变量体重(b=2.465,p<0.001),95%CI(1.650-3.281),常数项为119.327 。 直线线性回归方程可表示为:Y=119.327+2.465X 。(一般以样本数据中自变量取值范围为限)(Ⅴ)残差分析
当标准化残差图中散点的分布,绝大部分在±2倍标准差之间,在以0参考线的上下随机且均匀地散布时,可以认为模型数据拟合得较好。
统计预测详见☞☞☞【简单线性回归(二)】
(Ⅰ)
(Ⅱ)放入变量,单击paste
(Ⅲ)弹出如下所示对话框
(Ⅳ)
欲了解体重分别为45、55、65Kg时的双肾总体积的预测值, 输入如下语法: /LMATRIX=ALL 1 45; ALL 1 55; ALL 1 65(Ⅴ)当体重为45kg、55kg、65kg时,双肾总体积的预测值如下:
结果撰写
某医师测量了15名正常成年人的体重(Kg)与(CT)双肾总体积(ml)大小,数据的散点图见(I)。我们试用线性回归通过体重来预测双肾总体积。
结果表明,回归系数估计值为2.465(p<0.001),95%CI(1.650-3.281),线性回归方程可表示为:Y=119.327+2.465 X,R-square=0.766,预测的效果较好。
完
☟☟☟“”获取数据
挑灯 夜写,只为 好看☟☟☟