什么是线性变换

最新推荐文章于 2025-03-12 10:43:22 发布

彬彬侠

最新推荐文章于 2025-03-12 10:43:22 发布

阅读量1.4k

点赞数 15

分类专栏：数学基础文章标签：线性变换 Linear Transfor 数学变换向量映射矩阵机器学习深度学习

本文链接：https://blog.csdn.net/u013172930/article/details/145124206

版权

63 篇文章

订阅专栏

线性变换（Linear Transformation）是一种数学变换，用于将一个向量空间中的向量映射到另一个向量空间，同时保持加法和标量乘法的性质。这是线性代数中的核心概念之一，在机器学习、深度学习和计算机图形学等领域具有重要应用。

简单来说，线性变换可以通过矩阵乘法来表示，它的作用通常是对向量进行缩放、旋转或投影等操作。

给定两个向量空间 $V$ 和 $W$ ，一个映射 $T$ 是线性变换，当且仅当满足以下两个条件：

加法封闭性：
对于 $\mathbf{u}, \mathbf{v} \in V$ ，有：
$T(\mathbf{u} + \mathbf{v}) = T(\mathbf{u}) + T(\mathbf{v})$
标量乘法封闭性：
对于 $\mathbf{u} \in V$ 和任意标量 $\in \mathbb{R}$ ，有：
$\mathbf{u}) = c T(\mathbf{u})$

如果映射 $T$ 满足上述两个条件，则 $T$ 是一个线性变换。

在实际应用中，线性变换通常表示为矩阵 $A$ 作用于向量 $\mathbf{x}$ ：
$T(\mathbf{x}) = A \mathbf{x}$
其中：

矩阵 $A$ 决定了线性变换的具体性质，例如是否是缩放、旋转或投影。

缩放（Scaling）
- 将向量的长度按比例放大或缩小，但保持方向不变。
- 矩阵形式：
  $\begin{bmatrix} s_x & 0 \\ 0 & s_y \end{bmatrix}$
- 示例：
  $T(\mathbf{x}) = \begin{bmatrix} 2 & 0 \\ 0 & 3 \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \end{bmatrix} = \begin{bmatrix} 2x_1 \\ 3x_2 \end{bmatrix}$
旋转（Rotation）
- 将向量绕原点旋转一定角度。
- 矩阵形式（以 2D 为例）：
  $\begin{bmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{bmatrix}$
- 示例：
  将向量 $\mathbf{x} = [1, 0]^\top$ 逆时针旋转 90°：
  $\begin{bmatrix} 0 & -1 \\ 1 & 0 \end{bmatrix}$
投影（Projection）
- 将向量投影到某个子空间上，例如一条直线或一个平面。
- 矩阵形式（投影到单位向量 $\mathbf{n}$ 上）：
  $\mathbf{n} \mathbf{n}^\top$
反射（Reflection）
- 将向量关于某条直线或平面对称反射。
- 矩阵形式：
  $2\mathbf{n}\mathbf{n}^\top$
  其中 $\mathbf{n}$ 是反射平面的单位法向量。
剪切（Shear）
- 将向量沿某个方向倾斜。
- 矩阵形式（以 2D 为例）：
  $\begin{bmatrix} 1 & k \\ 0 & 1 \end{bmatrix}$

保持原点：
线性变换始终将原点 $\mathbf{0}$ 映射到原点：
$T(\mathbf{0}) = A \mathbf{0} = \mathbf{0}$
保持直线性：
线性变换会将直线映射为直线。
组合性：
多个线性变换的组合仍然是一个线性变换。假设有两个变换 $T_1(\mathbf{x}) = A_1 \mathbf{x}$ 和 $T_2(\mathbf{x}) = A_2 \mathbf{x}$ ，则组合变换 $T_2(T_1(\mathbf{x}))$ 可以用矩阵乘法表示：
$T_2(T_1(\mathbf{x})) = A_2 (A_1 \mathbf{x}) = (A_2 A_1) \mathbf{x}$
可逆性：
如果矩阵 $A$ 是非奇异的（即 $\det(A) \neq 0$ ），则线性变换是可逆的，且逆变换为：
$T^{-1}(\mathbf{y}) = A^{-1} \mathbf{y}$

在线性代数中，线性变换被用来描述矢量之间的映射。在深度学习中，线性变换扮演着重要角色：

全连接层：
全连接层本质上是一个线性变换，其形式为：
$\mathbf{y} = \mathbf{W} \mathbf{x} + \mathbf{b}$
其中：
- $\mathbf{W}$ 是权重矩阵。
- $\mathbf{b}$ 是偏置向量。
卷积操作：
卷积操作可以看作是线性变换在局部区域的应用。
特征提取：
在线性变换中，通过矩阵 $A$ 的特性，可以提取输入数据的特定特征，例如主成分分析（PCA）中使用的线性映射。