西瓜书学习笔记——核化线性降维（公式推导+举例应用）

Nie同学

于 2024-02-03 22:16:23 发布

阅读量1.1k

点赞数 24

分类专栏：机器学习文章标签：学习笔记机器学习

本文链接：https://blog.csdn.net/qq_46117575/article/details/136011247

版权

机器学习专栏收录该内容

16 篇文章 3 订阅

订阅专栏

本文介绍了核化线性降维技术，特别是核主成分分析(KPCA)，通过核技巧将数据映射到非线性特征空间进行降维。文章详细解释了算法原理，展示了如何通过径向基函数核和实验数据集进行降维并可视化结果。

摘要由CSDN通过智能技术生成

文章目录

- - 算法介绍
  - 实验分析

算法介绍

核化线性降维是一种使用核方法（Kernel Methods）来进行降维的技术。在传统的线性降维方法中，例如主成分分析（PCA）和线性判别分析（LDA），数据被映射到一个低维线性子空间中。而核化线性降维则通过使用核技巧，将数据映射到一个非线性的低维空间中。

核技巧的核心思想是通过一个非线性映射将原始数据转换到一个高维的特征空间，然后在该特征空间中应用线性降维方法。这种映射可以使用核函数来实现，例如径向基函数核（RBF核）或多项式核。

下面我们以核主成分分析（KPCA）为例子：

假定我们将高维特征空间中把数据投影到由 $\mathbf{W}$ 确定的超平面上，即PCA欲求解：

$\bigg(\sum_{i=1}^mz_iz_i^T\bigg)\mathbf{W}=\lambda\mathbf{W}\tag{1}$

其中 $z_i$ 是样本点 $x_i$ 在高维特征空间中的像，可知：

$\begin{aligned} \mathbf{W}&=\frac{1}{\lambda}\bigg(\sum_{i=1}^mz_iz_i^T\bigg)\mathbf{W}=\sum_{i=1}^mz_i\frac{z_i^T\mathbf{W}}{\lambda}\\ &=\sum_{i=1}^mz_i\alpha_i \end{aligned} \tag{2}$

其中 $\alpha_i=\frac{1}{\lambda}z_i^T\mathbf{W}$ (权重)。假设 $z_i$ 是通过原始空间中的样本点 $x_i$ 通过映射 $\phi$ 产生，即 $z_i=\phi(x_i),i=1,2,...,m$ 。若能被 $\phi$ 显式的表达出来，通过它将样本映射到高维特征空间，再从高维特征空间中使用PCA，可将式（1）变化为：

$\bigg(\sum_{i=1}^m\phi(x_i)\phi(x_i)^T\bigg)\mathbf{W}=\lambda\mathbf{W}\tag{3}$

式（2）变化为：

$\mathbf{W}=\sum_{i=1}^m\phi(x_i)\alpha_i\tag{4}$

一般情况下我们不知道 $\phi$ 的形式，故引入核函数：

$\kappa(x_i,x_j)=\phi(x_i)^T\phi(x_j)\tag{5}$

将式（4）和式（5）带入式（3）中有：

已知 $z_i=\phi(x_i)$ ，类比 $\mathbf{X}=\{x_1,x_2,...,x_m\}$ ，可以构造出 $\mathbf{Z}=\{z_1,z_2,...,z_m\}$ 。
$\begin{aligned} \bigg(\sum_{i=1}^m\phi(x_i)\phi(x_i)^T\bigg)w_j&=\lambda_jw_j\\ \bigg(\sum_{i=1}^mz_iz_i^T\bigg)w_j&=\lambda_jw_j\\ \mathbf{ZZ^T}w_j&=\lambda_jw_j\\ \mathbf{ZZ^T}\sum_{i=1}^m\phi(x_i)\alpha_i^j&=\lambda_j\sum_{i=1}^m\phi(x_i)\alpha_i^j\\ \mathbf{ZZ^T}\sum_{i=1}^mz_i\alpha_i^j&=\lambda_j\sum_{i=1}^mz_i\alpha_i^j\\ \mathbf{ZZ^TZ}\alpha^j&=\lambda_j\mathbf{Z}\alpha^j\\ \mathbf{ZZ^TZ}\alpha^j&=\mathbf{Z}\lambda_j\alpha^j\\ \mathbf{Z^TZ}\alpha^j&=\lambda_j\alpha^j\\ \end{aligned} \tag{6}$
其中 $\boldsymbol{\alpha}^j=\left(\alpha_1^j ; \alpha_2^j ; \ldots ; \alpha_m^j\right) \in \mathbb{R}^{m \times 1}$

令 $\mathbf{ZZ^T=K}$ ，那么上式可化为：

$\mathbf{K}\alpha^j=\lambda_j\alpha^j\tag{7}$

其中矩阵 $\mathbf{K}$ 的第 $i$ 行第 $j$ 列的元素 $\mathbf{K}_{ij}=z_i^Tz_j=\phi(x_i)^T\phi(x_j)=\kappa(x_i,x_j)$ 。

显然式（7）是一个特征值分解问题，取 $\mathbf{K}$ 最大的 $d^\prime$ 个特征值所对应的特征向量即可。

对新样本 $x=(x_1,x_2,...,x_m)$ （向量），其向高维特征空间的投影后的第 $j(j=1,2,...,d^\prime)$ 维坐标是：

$\begin{aligned} z^j&=w_j^T\phi(x)\\ &=\sum_{i=1}^m\alpha_i^j\phi(x_i)^T\phi(x)\\ &=\sum_{i=1}^m\alpha_i^j\kappa(x_i,x) \end{aligned} \tag{8}$

算法过程与PCA算法类似。

实验分析

数据集如下图所示：
在这里插入图片描述
读入数据集：

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# 读取数据集
data = pd.read_csv('data/correlated_dataset.csv')

# 提取特征和目标
X = data.drop('Target', axis=1).values
y = data['Target'].values

定义核函数：

# 核函数（径向基函数）
def rbf_kernel(x, y, gamma=1.0):
    return np.exp(-gamma * np.linalg.norm(x - y)**2)

计算以及中心化核矩阵：

# 计算核矩阵
def compute_kernel_matrix(X, gamma=1.0):
    n_samples = X.shape[0]
    K = np.zeros((n_samples, n_samples))
    for i in range(n_samples):
        for j in range(n_samples):
            K[i, j] = rbf_kernel(X[i], X[j], gamma)
    return K

# 中心化核矩阵
def center_kernel_matrix(K):
    n_samples = K.shape[0]
    one_n = np.ones((n_samples, n_samples)) / n_samples
    K_centered = K - one_n.dot(K) - K.dot(one_n) + one_n.dot(K).dot(one_n)
    return K_centered

计算特征值与特征向量：

# 计算特征值和特征向量
def compute_eigenvectors(K_centered, n_components):
    eigvals, eigvecs = np.linalg.eigh(K_centered)
    # 选择前n_components个最大特征值对应的特征向量
    idx = np.argsort(eigvals)[::-1][:n_components]
    return eigvecs[:, idx]

执行KPCA并绘制降维可视化结果：

# 数据中心化
X_centered = X - np.mean(X, axis=0)

# 计算核矩阵
K = compute_kernel_matrix(X_centered)

# 中心化核矩阵
K_centered = center_kernel_matrix(K)

# 选择降维后的维度
n_components = 6

# 计算特征向量
eigenvectors = compute_eigenvectors(K_centered, n_components)

# 降维
X_pca = K_centered.dot(eigenvectors)

# 可视化降维结果
plt.scatter(X_pca[:, 0], X_pca[:, 1], c=y, cmap='viridis')
plt.title('Kernelized PCA - 2D Projection')
plt.xlabel('Principal Component 1')
plt.ylabel('Principal Component 2')
plt.show()

在这里插入图片描述

Nie同学

关注

24
点赞
踩
21

收藏

觉得还不错? 一键收藏
打赏
0
评论
西瓜书学习笔记——核化线性降维（公式推导+举例应用）

核化线性降维是一种基于核方法的降维技术，适用于处理非线性数据结构。以核主成分分析（KPCA）为例，通过引入核函数，将数据映射到高维特征空间，并利用核矩阵的特征值分解实现降维。本文利用径向基函数核对数据集进行核化PCA，展示了降维后的可视化效果。
复制链接

扫一扫