34-高维数据映射为低维数据

最新推荐文章于 2025-04-14 15:02:58 发布

蓝子娃娃

最新推荐文章于 2025-04-14 15:02:58 发布

阅读量3.4k

点赞数 2

分类专栏：机器学习

本文链接：https://blog.csdn.net/qq_41033011/article/details/109128975

版权

机器学习专栏收录该内容

89 篇文章

订阅专栏

本文详细介绍了如何使用主成分分析(PCA)技术将高维数据映射为低维数据，包括求解主成分、数据降维及逆向映射的过程，并提供了具体的Python实现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言

上一篇博客介绍了如何求解一个数据集相应的前 $n$ 个主成分，但是在这里需要注意，虽然求出了这些主成分所代表的坐标轴的方向，但是我们的数据集本身依然是 $n$ 维的，并没有进行降维，那么具体我们是如何利用 $P C A$ 法对数据进行降维的呢？这篇博客主要介绍了如何从原有的高维数据向低维数据进行映射。

高维数据映射为低维数据

比如我这里有一个 $X$ ，它有 $m$ 个样本， $n$ 个特征。假设此时我已经求出来 $X$ 的前 $k$ 个主成分，每一个主成分代表一个单位方向，用 $W$ 表示，这个 $W$ 也是一个矩阵，有 $k$ 行，代表求出的前 $k$ 个主成分，对于每一行有 $n$ 个元素，代表每一个主成分那个坐标轴应该有 $n$ 个元素。

在这里插入图片描述
那么问题来了，如何将 $X$ 从 $n$ 维转换成 $k$ 维呢？回顾一下之前所学习的过程。

在这里插入图片描述
对于我们的一个样本（对应 $X$ 的一行）和对应的 $W (i)$ （ $W_k$ 的某一行）进行点乘，点乘后的结果就是将这一个样本映射到 $W (i)$ 这个轴上得到的模。如果我们将这一个样本和 $k$ 个 $W (i)$ 分别进行点乘，那么得到的就是这一个样本在这 $k$ 个方向上的模（即 $k$ 个模），这 $k$ 个元素就能表示这一个样本映射到我们新的 $k$ 个坐标轴上相应样本的大小。所以这个 $W_k$ 有 $k$ 行的话，我们把每一行叫做 $W_1$ ， $W_2$ …一直到 $W_k$ 的话，我们的样本 1 乘以 $W_1$ ，样本 1 乘以 $W_2$ …一直到样本 1 乘以 $W_k$ ，这样就得到了 $k$ 个数组成的向量，就是样本 1 映射到了 $W_k$ 这 $k$ 个坐标系上得到的一个新的 $k$ 维的向量。由于 $k$ 是比 $n$ 小的，我们就完成了一个样本从 $n$ 维向量到 $k$ 维的映射。那么这个过程以此类推，我们的样本2，样本3，一直到样本 $m$ 都这样做，我们就将所有的样本从 $n$ 维映射到了 $k$ 维。

其实这个过程我们就只做了一个矩阵的乘法：
在这里插入图片描述
这里为什么要进行转置（ $T$ ）呢？我们的目的是要使 $X$ 的每一行和 $W_k$ 的每一行做乘法，但是矩阵的运算是 $X$ 的每一行和 $W_k$ 中的每一列做乘法，所以我们要将 $W_k$ 进行一个转置。也可以这么理解， $X$ 是一个 $m$ x $n$ 的矩阵， $W_k$ 是一个 $k$ x $n$ 的矩阵，所以 $W_k^T$ 就是一个 $n$ * $k$ 的矩阵，最后二者相乘得到一个矩阵 $X_k$ 就是一个 $m$ x $k$ 的矩阵。

一旦我们获取了 $X_k$ （ $m$ x $k$ ）之后
在这里插入图片描述
而对于 $W_k$ （ $k$ x $n$ ）矩阵：

依然可以反过来相应的将其恢复成原来的 $n$ 维的数据，那么这个恢复（ $r e s t o r e$ ）的过程也很简单。其实就是现在我们每一行数据有 $k$ 个元素，这 $k$ 个元素和 $W_k$ 的每一列去做乘法，我们此时把 $X_k$ 中的每一行映射到 $W_k$ 中每一列对应的方向中，一共有 $n$ 列，最终会得到 $m$ x $n$ 的矩阵。当然这个恢复回来的矩阵已经不是原来的 $X$ 矩阵了，这是因为我们在降维的过程中，其实丢失了一些信息，那么再恢复回来，丢失的这些信息也是恢复不回来的。但是这个反向的操作本身从数学的角度是成立的，那么这两个矩阵相乘就会的得到 $X_m$ ：
在这里插入图片描述
那么这个 $X_m$ 和原来的 $X$ 的区别是怎样的？我们马上用编程来实验：

# PCA.py
import numpy as np

class PCA:
    def __init__(self, n_components):
        """初始化PCA"""
        assert n_components >= 1, "n_components must be valid"
        self.n_components = n_components
        self.components_ = None
    def fit(self, X, eta=0.01, n_iters=1e4):
        """获得数据集X的前n个主成分"""
        assert self.n_components <= X.shape[1], \
            "n_components must not be greater than the feature number of X"
        def deamen(X): # 均值归为0
            return X - np.mean(X, axis=0)
        def f(w, X):
            return np.sum((X.dot(w)) ** 2) / len(X)
        def df(w, X):
            return X.T.dot(X.dot(w)) * 2. / len(X)
        def direction(w):
            return w / np.linalg.norm(w)
        def first_component(X, initial_w, eta, n_iters=1e4, epsilon=1e-8):
            w = direction(initial_w)
            i_iter = 0
            while i_iter < n_iters:
                gradient = df(w, X)
                last_w = w
                w = w + eta * gradient
                w = direction(w)

                if(abs(f(w, X) - f(last_w, X)) < epsilon):
                    break
                i_iter += 1
            return w
        X_pca = deamen(X)
        self.components_ = np.empty(shape=(self.n_components, X.shape[1]))
        for i in range(self.n_components):
            initial_w = np.random.random(X_pca.shape[1])
            w = first_component(X_pca, initial_w, eta, n_iters)
            self.components_[i, :] = w
            X_pca = X_pca - X_pca.dot(w).reshape(-1, 1) * w
        return self
    def transform(self, X):
        """将给定的X，映射到各个主成分分量中"""
        assert X.shape[1] == self.components_.shape[1]

        return X.dot(self.components_.T)
    def inverse_transform(self, X):
        """将给定的X，反向映射会原来的特征空间"""
        assert X.shape[1] == self.components_.shape[0]
        return X.dot(self.components_)
    def __repr__(self):
        return "PCA(n_components=%d)" % self.n_components

在这里插入图片描述

通过这个例子，inverse_transform 的过程中是丢失信息的。也就是说，我们将我们的样本进行降维，在降维的过程中肯定失去了一些信息，失去的这些信息并不能 $r e s t o r e$ 回来， $r e s t o r e$ 的过程只不过在高维的空间里表达这些低维的样本而已，就像这些红色的点。