r语言pls分析_R语言中的偏最小二乘PLS回归算法

本文介绍了如何使用R语言进行偏最小二乘(PLS)回归分析,以解决高度成分和多重共线性的数据集问题。通过案例展示了PLS回归在处理多个响应变量的能力,并探讨了如何评估模型的性能和选择最佳组件数量。
摘要由CSDN通过智能技术生成

偏最小二乘回归:

我围绕结构方程建模(SEM)技术进行一些咨询,以解决独特的业务问题。我们试图识别客户对各种产品的偏好,传统的回归是不够的,因为数据集的高度分量以及变量的多重共线性。PLS是处理这些有问题的数据集的强大而有效的方法。

主成分回归是我们将要探索的一种选择,但在进行背景研究时,我发现PLS可能是更好的选择。我们将看看PLS回归和PLS路径分析。我不相信传统的扫描电镜在这一点上是有价值的,因为我们没有良好的感觉或理论来对潜在的结构做出假设。此外,由于数据集中的变量数量众多,我们正在将SEM技术扩展到极限。Haenlein,M&Kaplan,A.,2004年,“初步指南偏最小二乘分析”,Understanding

Statistics,3(4),283-297中可以找到关于这个限制的有趣讨论。

[1]“diesel”“turbo”“two.doors”“hatchback”“wheel.base”

[6]“length”“width”“height”“curb.weight”“eng.size”

[ 11]“马力”“峰值.rpm”“价格”“符号”“city.mpg”

[16]“ highway.mpg ”

这些数据有16个变量和30个观测值。它包含在plsdepot包中。

关于PLS回归的一个有趣的事情是你可以有多个响应变量,plsdepot可以适应这种类型的分析。在这种情况下,我只想分析一个Y变量,那就是价格。

该包的一个怪癖是你需要将预测变量和响应分开,即将响应变量列放在数据帧的末尾。要做到这一点,我只是运行这个优雅的代码,我找到了某处...

#把变量价格(第13列)放在最后

pls1 $ x.scores X分数(T分量)

$ x.loads X-loadings

$ y.scores Y-scores(U-components)

$ y.loads Y-loadings

$ cor.xyt得分相关性

$ raw.wgs原始权重

$ mod.wgs修改权重

$ std.coefs标准系数

$ reg.coefs常规系数

$ R2 R平方

$ R2Xy解释Xy的方差T

$ y.pred y-预测

$ resid 残差

$ T2 T2经济系数

Q2第二季度交叉验证这个包中有很多,我强烈建议阅读优秀的教程来了解更多信息。

>#相关图; 注意什么与价格高度相关

#plot每个观测预测与实际

我们将不得不继续查看不同数量的组件以确定最佳模型,并从实际角度查看潜在变量是否有意义。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值