偏最小二乘回归(PLSR)- 1 概览

1. 概览

偏最小二乘算法,因其仅仅利用数据X和Y中部分信息(partial information)来建模,所以得此名字。其总体处理框架体现在下面两图中。

建议先看第2部分,对pls算法有初步了解后再看此框架,会有更全面深入的体会。

image得到

                                                     image

转载于:https://www.cnblogs.com/pegasus/p/3396081.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
PLSR与PCR的比较 PLS的权重stats.W是原始变量的线性组合系数,确定了PLS的主成分,即他们描述了PLSR的每个主成分在多大程度、在哪个方向上依赖于原始变量,这点可以通过公式XS=X0*W看出。 类似的,PCA的载荷向量XL描述了PCR中每个主成分在多大程度上依赖于原始变量,可以通过公式XS=X0*XL看出。 无论对于小二回归还是主成分回归,每个主成分的物理意义可以通过观察它在哪个变量上权重最大来解释一下。例如,在这些光谱数据上,可以将那么大的波峰解释为出现在汽油中的化合物,然后观察几个主成分的权重找出一些这样的化合物。从这一角度出发,越少的主成分解释起来越简单一些,通常,小二回归模型需要比较少的主成分就足够预测组分值,所以,它通常是更简约的模型。 另一方面,对于每一个原始变量,PLSR和PCR都要得到一个回归系数和一个截距,从这个意义上讲,没有哪个模型更简约,因为,不管用几个主成分,两个模型都要依赖于所有的原始变量。 然而,最终的目的是减少原始变量集合为一个更小的子集并仍能对组分值进行准确预测。例如,能够用PLS的权重或PCA的载荷向量来选择对每个主成分贡献最大的变量。PCR模型中的一些主成分更适合于描述原始光谱变量,可能对于与组分值无关的一些变量有很大的权重,因此,PCR模型可能导致存有对预测没什么必要的变量。一般情况下,PLSR模型比PCR模型对组分值有更好的预测结果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值