回归分析用于:
–根据至少一个自变量的值来预测因变量的值
–解释自变量变化对因变量的影响
多元线性回归模型是:
•将简单的线性回归扩展到多个因变量
•描述以下各项之间的线性关系:单个连续的Y变量和几个X变量
•得出关于关系的推论:根据X1,X2,…,Xp预测Y的值。
•研究问题:IV的某种组合在多大程度上可预测DV?:例如 年龄,性别,食物消费类型/数量在多大程度上可预测低密度脂质水平
多元线性回归模型满足的一些假设条件:
•测量级别:
– IV –两个或多个,连续或二分
– DV-连续
•样本量–每个IV足够的病例数
•线性:双变量关系是否为线性
•恒定方差(大约最佳拟合线)–同方性
•多重共线性:IV之间没有多重共线性
•多元离群值
•关于预测值的残差的正态性
不同的回归方法:
•直接:同时输入所有IV
•从前向后:逐个输入IV,直到没有要输入的重要IV。
•从后向前:IV逐个删除,直到没有要删除的重要IV。
•分步回归:前进和后退的组合
•分层回归:在步骤中输入IV
相关系数-ρ
•相关系数衡量总体(ρ&#