基于R语言的PLS算法的实现及研究
目录
使用的开发工具
偏最小二乘的设计思想
基于R语言、MATLAB的偏最小二乘的实现
通径分析
测定系数
实验分析
使用的开发工具
R 语言(R是用于统计分析、绘图的语言和操作环境。它是一个用于统计计算和统计制图的优秀工具。)
MATLAB(它是一种以矩阵运算为基础的交互式程序语言。它作为一种编程语言和可视化工具,可解决工程、科学计算和数学学科中许多问题。)
偏最小二乘回归法
最小二乘
偏最小二乘
1.数目较少
2.无多重共线性
3.各解释变量与反应变量之间的关系易于解释
1.在自变量存在严重多重共线性时可以进行回归建模;
2.在样本点个数比变量个数(维数)明显过少时可以进行
回归建模;
3. PLS模型可以识别系统信息与噪声;
4. PLS模型中,每一个自变量的回归系数容易解释;
5. PLS最终回归模型中包含原有的所有自变量。
偏最小二乘回归法
算法的设计思想
①两组潜变量分别最大程度承载自变量与因变量的变异信息;
②二者之间的协方差最大化(相关程度最大)。
算法的设计思想
提取多少个主成分最合适???
交叉性检验
>=0.0975
实例分析(基于MATLAB)
芦荟大黄素
大黄素
大黄酸
大黄酚
大黄素甲醚
厚朴酚
和厚朴酚
橙