偏最小二乘,主成分分析,主成分回归,奇异值之间的关系

在统计中,主成分回归(PCR)是一种基于主成分分析(PCA)的回归分析技术。 在PCR中,不是直接对解释变量进行因变量回归,而是将解释变量的主要成分用作回归变量。

基于奇异值分解(SVD)的偏最小二乘版本提供了一种内存有效的实现方式,可用于解决高维问题,例如在消费级硬件上将数百万个遗传标记与成象遗传学中的成千上万个成象特征相关联。 [13]

PLS相关性(PLSC)是另一种与PLS回归相关的方法,最近在运动科学中也使用[17]来量化数据之间关系的强度套。通常,PLSC将数据分为两个块(子组),每个块包含一个或多个变量,然后使用奇异值分解(SVD)来确定数据之间可能存在的任何关系(即共享信息量)的强度。两个组成部分子组。 [18]通过使用SVD来确定正在考虑的子组的协方差矩阵的惯性(即奇异值的总和)来做到这一点。 [18]基于奇异值分解(SVD)的PLS版本提供了一种内存有效的实现方式,可用于解决高维问题,例如在消费者级别上将数百万个遗传标记与成象遗传学中的成千上万个成像特征相关联硬件。

用于计算PCR和PLS的算法是不同的,例如,PCR使用PCA并使用奇异值分解(SVD),为什么PLS对矩阵进行膨胀或收缩。一维的Y的系数含义与多维的Y相同,只是在多维中可以关联Y得分。然后将这些系数缩放到参考值以具有确定能力,并且它们使您知道参考值的分数在平面上的哪个位置。例如,它有助于了解您的验证数据是否在Y方面与校准数据相距甚远,就像X分数可以帮助您了解您的验证数据是否与X方面的校正数据相距遥远。

实际上,PCR和PLS之间存在很大的差异(即使对于一个向量y)也是如此。在PCR中,用于回归分析的PCA得分是最能解释数据X的得分(投影空间仅取决于X),在PLS中,X的投影空间对X和y都表示。因此,PLS通常以较少的潜在变量获得与PCR相同的结果。

我认为,它们之间的选择取决于X和y数据的尺寸和噪声(错误)量。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值