【大模型与机器学习解惑】机器学习里的 “提取特征” 跟数学里矩阵的特征值，特征向量以及特征矩阵是什么关系？

最新推荐文章于 2025-05-01 11:41:26 发布

云博士的AI课堂

最新推荐文章于 2025-05-01 11:41:26 发布

阅读量1k

点赞数 26

分类专栏：大模型技术开发与实践哈佛博后带你玩转机器学习深度学习文章标签：机器学习矩阵人工智能特征分解特征提取深度学习 AI数学

本文链接：https://blog.csdn.net/l35633/article/details/147474285

版权

哈佛博后带你玩转机器学习同时被 3 个专栏收录

243 篇文章

订阅专栏

大模型技术开发与实践

238 篇文章

订阅专栏

深度学习

182 篇文章

订阅专栏

概述

在机器学习中，“特征提取”（feature extraction）是指将原始数据映射为有助于模型学习的数值表示；而在线性代数里，“特征值”“特征向量”及“特征矩阵”则刻画矩阵的内在性质。二者在 PCA、谱聚类 等算法中交汇：ML 用特征值分解来寻找数据的主方向，但其“特征”本身各有不同的含义和作用。下文将系统对比二者的概念、联系和区别，并辅以 Python 代码示例帮助理解。

一、机器学习中的特征提取

定义：将文本、图像、信号等原始数据转换为模型易用的数值特征，减少冗余同时保留判别信息。
方法：
1. 手工方法：TF–IDF、词袋模型、信号局部统计量等。
2. 自动化方法：基于降维（PCA、t-SNE）、深度网络中间层输出等。
3. 混合方案：先用 GBDT 提取叶节点特征，再与神经网络结合。
目的：提高模型性能、加速训练、降低过拟合风险。

工具示例（scikit-learn）：

from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler

X_scaled = StandardScaler().fit_transform(X_raw)
pca = PCA(n_components=3)
X_pca = pca.fit_transform(X_scaled)
print("方差解释比", pca.explained_variance_ratio_)

此代码将高维数据降至 3 维主成分，用于后续模型训练。

二、线性代数中的特征值/向量/矩阵

特征值 (Eigenvalue)：对方阵 $A$ ，若存在非零向量 $v$ 使 $A\,v=\lambda\,v$ ，则 $\lambda$ 称为 $A$ 的特征值。
特征向量 (Eigenvector)：与上述 $\lambda$ 配对的非零向量 $v$ ，表示线性变换在该方向的伸缩不改变方向。
特征矩阵 (Modal Matrix)：由所有特征向量按列构成的矩阵 $V$ ，若 $A=V\Lambda V^{-1}$ ，则完成对角化。

Python 示例：

import numpy as np

A = np.array([[6, 8],
              [2,12]])
vals, vecs = np.linalg.eig(A)
print("特征值:", vals)
print("特征向量:\n", vecs)

输出

\lambda

与对应的

v

，揭示矩阵的主方向与伸缩系数。

三、二者的交集—PCA 与谱方法

PCA：对数据协方差矩阵 $\Sigma$ 做特征分解，取最大特征值对应的特征向量作为主成分，实现降维并保留最大方差。
谱聚类：构建图拉普拉斯矩阵 $L$ ，取前 $k$ 个最小特征值对应的特征向量作为嵌入，再用 K-Means 聚类。
图神经网络：对图邻接矩阵做谱分解，可提取全局图结构特征用于节点分类与链接预测。

四、本质区别

维度	ML 特征提取	线性代数特征
含义	数据表示的数字描述	矩阵自身的伸缩方向与系数
生成方式	手工设计或自动学习	求解特征分解或 SVD
用途	模型输入、特征工程	矩阵分析、降维（PCA）、谱聚类等
可解释性	与任务语义相关，需人工定义	数学固有属性，可直接量化与解释

五、完整示例：PCA 与特征值对比

import numpy as np
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler

# 构造示例数据
X = np.array([[2.5, 2.4],
              [0.5, 0.7],
              [2.2, 2.9],
              [1.9, 2.2],
              [3.1, 3.0],
              [2.3, 2.7],
              [2.0, 1.6],
              [1.0, 1.1],
              [1.5, 1.6],
              [1.1, 0.9]])

# 标准化
Xs = StandardScaler().fit_transform(X)

# PCA 降至 2 维
pca = PCA(n_components=2)
Xp = pca.fit_transform(Xs)
print("PCA 特征值:", pca.explained_variance_) 

# 协方差矩阵特征分解
cov = np.cov(Xs, rowvar=False)
vals, vecs = np.linalg.eig(cov)
print("协方差特征值:", vals)
print("协方差特征向量:\n", vecs)