EverydayOneCat
💯💯!
![cacd00df1fa0ccce9f98ac004a3f759a72ba7ef1.jpg@518w_1e_1c](https://pluto-1300780100.cos.ap-nanjing.myqcloud.com/img/cacd00df1fa0ccce9f98ac004a3f759a72ba7ef1.jpg@518w_1e_1c.jpg)
知识点
1.偏最小二乘回归介绍
偏最小二乘回归(PLS-Partial Least Squares)是一种新型的多元统计数据分析方法,是一种多因变量对多自变量的回归建模方法,是对最小二乘方法的推广。
优点:
1)提供了一种多因变量对多自变量的回归建模方法;
2)有效地解决变量之间的多重共线性问题;
3)适合当样本点数量少于自变量个数时进行回归建模;
4)最终模型中含原有所有自变量,回归系数容易解释。
5)计算简单、预测精度高,易于定性解释。
偏最小二乘回归≈主成分分析+典型相关分析+多元回归
2.偏最小二乘回归法的建模
(1)建立回归方程进行共线性检验
(2)若存在共线性,进行偏最小二乘回归
(3)确定成分个数
(4)建立偏最小二乘回归模型,进行解释
例:某康复俱乐部对20名中年人测量了
三个生理指标:体重x1, 腰围x2, 脉搏x3
三个训练指标: 单杠y1, 弯曲y2, 跳高y3
试用偏最小二乘回归建立由三个生理指标分别预测三个训练指标的回归模型。
![image-20200718112522359](https://pluto-1300780100.cos.ap-nanjing.myqcloud.com/img/image-20200718112522359.png)
SAS代码:
data example;
input x1-x3 y1-y3 @@;
cards; @@:/**/指针控制符,读取下面数据时自动换行
输入数据
;
proc corr data=example; /*proc:过程步的开始,表示调用*/
var x1-x3 y1-y3; /*corr:相关系数矩阵*/
run;
proc pls data=example cv=one details;/*pls: 偏最小二乘回归;cv=one:舍一交叉有效性检验*/
model y1-y3=x1-x3/solution; /*solution:标准化和原本的都有*/
run;
相关系数矩阵:
![image-20200718112747463](https://pluto-1300780100.cos.ap-nanjing.myqcloud.com/img/image-20200718112747463.png)
1.体重和腰围正相关; 2.体重、腰围与脉搏负相关;
3.单杠、跳高、弯曲的训练成绩与体重、腰围负相关,与脉搏正相关
用交叉验证法确定提取成分个数:
![image-20200718112912058](https://pluto-1300780100.cos.ap-nanjing.myqcloud.com/img/image-20200718112912058.png)
由结果可知,采用舍一交叉验证法提取1个成分,可使得PRESS最小