回归分析用于:
–根据至少一个自变量的值来预测因变量的值
–解释自变量变化对因变量的影响
多元线性回归模型是:
•将简单的线性回归扩展到多个因变量
•描述以下各项之间的线性关系:单个连续的Y变量和几个X变量
•得出关于关系的推论:根据X1,X2,…,Xp预测Y的值。
•研究问题:IV的某种组合在多大程度上可预测DV?:例如 年龄,性别,食物消费类型/数量在多大程度上可预测低密度脂质水平
多元线性回归模型满足的一些假设条件:
•测量级别:
– IV –两个或多个,连续或二分
– DV-连续
•样本量–每个IV足够的病例数
•线性:双变量关系是否为线性
•恒定方差(大约最佳拟合线)–同方性
•多重共线性:IV之间没有多重共线性
•多元离群值
•关于预测值的残差的正态性
不同的回归方法:
•直接:同时输入所有IV
•从前向后:逐个输入IV,直到没有要输入的重要IV。
•从后向前:IV逐个删除,直到没有要删除的重要IV。
•分步回归:前进和后退的组合
•分层回归:在步骤中输入IV
相关系数-ρ
•相关系数衡量总体(ρ)中X和Y之间线性关联的强度。
•通过样本估计(r)
相关分析
•相关分析用于测量两个变量之间的关联强度(线性关系)
–相关仅与关系的强度有关
–没有因果关系暗示
计算相关系数:
相关系数的解释力度,随着数字的增大而变大,具体来看:
多元回归中的步骤
1.陈述研究假设。
2.陈述原假设
3.收集数据
4.首先分别评估每个变量(获得集中趋势和离散度的度量;频率分布;图形);变量是正态分布的吗?
5.一次评估每个自变量与因变量的关系(计算相关系数;获得散点图);这两个变量线性相关吗?
6.评估所有自变量之间的关系(获得所有自变量的相关系数矩阵);自变量之间的相关性是否太高?
7.根据数据计算回归方程
8.为每个系数和整个方程计算并检查适当的关联度量和统计显着性检验
9.接受或拒绝原假设
10.拒绝或接受研究假设
11.解释调查结果的实际含义