部分最小二乘--PLS

部分最小二乘(PLS)是一种处理多重共线性问题的统计方法,通过找到内部独立的成分Z,使得Y对Z进行线性回归。与主成分回归(PCR)不同,PLS考虑了Y和X的关系,使得每个成分zi按预测Y的能力排序。PLS的目标是找到最相关的少数成分,以降低维度并最大化Y与X的关联性。在实际应用中,需要确定合适的成分数量k,以保持信息的同时避免增加方差。
摘要由CSDN通过智能技术生成

Why

和岭回归要解决的问题一样,同样是多重共线性导致的 R 接近奇异使得 ||β|| 的估算值 ||β^|| 过大。

What

(Yi,xi) 是第i个样本, xi 是p维存在严重多重共线性(其实就是自变量有相关性,极端情况是线性代数里的线性相关)。和岭回归一样,首先做standardized(去中心干掉了截距,scale使得 β 具有可比性;和correlation transformation不同的是后者还需要除个n-1, 目标是为了减少高次项和低次项之间的关联)。再把 xi 变形成内部独立的 zi . 换句话说我们要找到 f1,...fp 使得 zi1,...zip 相互独立,其中 zi1=fT1xi,...,zip=fTpxi 。然后我们再放心的用 Y Z 做线性回归即可。
因为 zi 内部是独立的,做线性回归时我们甚至可以让 Y 分别对 zi1,...zip 做回归而不会影响它们的系数。 zi1,...zip 称作PLS的成分(components).

主成分回归(PCR)和PLS一脉传承,只是找 f1,...fp 方法不同。PCR对 XTX 做谱分解找出特征值并利用特征值构建 z 。在此过程中并没有考虑 Y X 的关系,而PLS考虑了 Y X 的。因此PLS存在一个顺序,使得 zi1</

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值