2024-12-9-sklearn学习（8）监督学习-交叉分解八月湖太平，涵虚混太清。气蒸云梦泽，波撼岳阳城。孟浩然《临洞庭湖上张丞相》

原创已于 2024-12-25 00:28:59 修改 · 827 阅读

21 ·

CC 4.0 BY-SA版权

文章标签：

#sklearn #学习 #人工智能 #python #机器学习 #交叉分解

于 2024-12-10 15:00:00 首次发布

sklearn 专栏收录该内容

50 篇文章

订阅专栏

文章目录

sklearn学习(8) 监督学习-交叉分解

sklearn学习(8) 监督学习-交叉分解

文章参考网站：
https://sklearn.apachecn.org/
和
https://scikit-learn.org/stable/

交叉分解模块主要包含两个算法族: 偏最小二乘法（Partial Least Squares, PLS）和典型相关分析（Canonical Correlation Analysis, CCA）。

交叉分解算法可以找到两个矩阵（X 和 Y）之间的基本关系。它们是用于对这两个空间中的协方差结构进行建模的潜在变量方法。它们将尝试在 X 空间中找到解释 Y 空间中最大多维方差方向的多维方向。换句话说，PLS 将X和Y都投影到较低维子空间中，以使transformed(X) 和 transformed(Y)之间的协方差最大。

PLS 与主成分回归(PCR)有相似之处，其中样本首先被投影到低维子空间，并且使用transformed(X)预测目标y。PCR 的一个问题是降维是无监督的，并且可能会丢失一些重要变量：PCR 会保留方差最大的特征，但方差较小的特征可能与预测目标有关。在某种程度上，PLS 允许相同类型的降维，但考虑到目标y。以下示例说明了这一事实：*主成分回归与偏最小二乘回归。

除了 CCA 之外，PLS 估计器特别适用于预测因子矩阵的变量多于观测值，以及特征之间存在多重共线性的情况。相比之下，标准线性回归在这些情况下会失效，除非对其进行正则化。

本模块包含的课程有PLSRegression、 PLSCanonical和CCAPLSSVD

8.1 PLS Canonical

我们在此描述中使用的算法PLSCanonical。

给定两个中心矩阵 $\in \mathbb{R}^{n \times d}$ 和 $Y∈\mathbb{R}^{n×t}$ 以及一些组件K， PLSCanonical流程如下：

放 $X_1$ 到 $X$ 和 $Y_1$ 到 $Y$ .然后，对于每个 $\in [1, K]$ ：

a)计算 $u_k \in \mathbb{R}^d$ 和 $v_k \in \mathbb{R}^t$ ，互协方差矩阵的第一个左奇异向量和第一个右奇异向量 $C = X_k^T Y_k$ 。 $u_k$ 和 $v_k$ 被称为权重。根据定义， $u_k$ 和 $v_k$ 被选择，以便最大化投影之间的协方差 $X_k$ 以及预计的目标，即 $\text{Cov}(X_k u_k,Y_k v_k)$ 。
b) 项目 $X_k$ 和 $Y_k$ 在奇异向量上获得分数： $\xi_k = X_k u_k$ 和 $\omega_k = Y_k v_k$
c) 回归 $X_k$ 在 $\xi_k$ ，即找到一个向量 $\gamma_k \in \mathbb{R}^d$ 这样秩为 1 的矩阵 $\xi_k \gamma_k^T$ 尽可能接近 $X_k$ . 执行相同操作 $Y_k$ 和 $\omega_k$ 获得 $\delta_k$ . 向量 $\gamma_k$ 和 $\delta_k$ 被称为载荷。
d)放气 $X_k$ 和 $Y_k$ ，即减去秩 1 近似值： $X_{k+1} = X_k - \xi_k \gamma_k^T$ ，和 $Y_{k + 1} = Y_k - \omega_k \delta_k^T$ 。

最后，我们近似地 $X$ 作为秩为 1 的矩阵之和： $\Xi \Gamma^T$ 在哪里 $\Xi \in \mathbb{R}^{n \times K}$ 列中包含分数，并且 $\Gamma^T \in \mathbb{R}^{K \times d}$ 行中包含载荷。同样，对于 $Y$ ，我们有 $\Omega \Delta^T$ 。

请注意，训练数据的投影 $X$ 和 $Y$ 的分数矩阵分别是 $\Xi$ 和 $\Omega$ 。

步骤*a)*可以通过两种方式执行：要么计算 $C$ 并且只保留奇异值最大的奇异向量，或者直接用幂法计算奇异向量，这对应于参数'nipals'的选项algorithm。

在这里插入图片描述

8.2 PLSSVD

PLSSVD 是之前描述的简化版本PLSCanonical ：不是迭代地缩小矩阵 $X_k$ 和 $Y_k$ ，PLSSVD计算 SVD $C = X^TY$ 仅一次，并存储n_components 对应矩阵U和V和中最大奇异值对应的奇异向量，对应x_weights_ 和y_weights_ 属性。这里，转换后的数据只是transformed(X) = XU和transformed(Y) = YV。

如果n_components == 1， PLSSVD 和 PLSCanonical严格等价。

8.3 PLS 回归

该PLSRegression估计量与类似 PLSCanonical，algorithm='nipals'但有 2 个显著差异：

在步骤a)中，用幂法计算 $u_k$ 和 $v_k$ ， $v_k$ 从未被规范化。
在步骤 c) 中，目标 $Y_k$ 使用投影来近似 $X_k$ (IE $\xi_k$ ),而不是投影 $Y_k$ （IE $ω_k$ ）。也就是说，载荷计算不同。因此，步骤d）中的放气也会受到影响。

predict 这两个修改会影响和的输出 transform，它们与PLSCanonical 的输出不同。此外，虽然中的 PLSCanonical 组件数量受 min(n_samples, n_features, n_targets)限制，但这里的限制是 $X^TX$ 在 IE min(n_samples, n_features)