矩阵运算

最新推荐文章于 2023-05-15 23:19:12 发布

强劲九

最新推荐文章于 2023-05-15 23:19:12 发布

阅读量1.2k

点赞数

分类专栏：数学文章标签：数学矩阵运算线性代数

本文链接：https://blog.csdn.net/weixin_39679367/article/details/80385185

版权

数学专栏收录该内容

13 篇文章 2 订阅

订阅专栏

参考：
Wikipedia – Matrix calculus
Wikipedia 上对于矩阵的微分描述得很详细。

给定两个矩阵 $A=\begin{pmatrix} a_{ij}\end{pmatrix}_{m \times n}$ 和 $B=\begin{pmatrix} b_{ij}\end{pmatrix}_{m \times n}$ ，它们的阿达马积和克罗内克积定义如下：
阿达马积（Hadamard product）： $\circ B=\begin{pmatrix} a_{ij} \cdot b_{ij} \end{pmatrix}_{m \times n}$ ，又称逐元素积（elementwise product）。
克罗内克积（Kronnecker product）： $A\bigotimes B=\begin{pmatrix}a_{11} B& \cdots & a_{1n}B \\ \vdots & \ddots & \vdots \\ a_{m1}B & \cdots & a_{mn}B \end{pmatrix}$

矩阵的求导：

1. 矩阵 Y 对标量 $x_i$ 求导：

相当于每个元素求倒数后转置一下，注： $\times N$ 矩阵求导后变 $\times M$ 矩阵

$\frac{\partial Y}{\partial x_{i}}=\begin{bmatrix} \frac{\partial Y_{ij}}{\partial x_{i}}\end{bmatrix}^T$

2. 标量 $y_i$ 对列向量 $x$ 求导：

$\frac{\partial y_i}{\partial x}=\begin{bmatrix} \frac{\partial y_{i}}{\partial x_{1}} \\ \frac{\partial y_{i}}{\partial x_{2}} \\ \vdots \end{bmatrix}$

3. 行向量 $y^T$ 对列向量 $x$ 求导：

注： $\times M$ 矩阵对 $\times 1$ 矩阵求导后变 $\times M$ 矩阵

$\frac{\partial y^T}{\partial x}=\frac {\begin{bmatrix} y_1&y_2&\cdots &y_n\end{bmatrix}}{\begin{bmatrix}x_1 \\ x_2 \\ \vdots \\x_n \end{bmatrix}}=\begin{bmatrix} \frac{\partial y_{1}}{\partial x} \\ \frac{\partial y_{2}}{\partial x} \\ \vdots \\ \frac {\partial y_{n}}{\partial x}\end{bmatrix}$

有如下公式：

① $\frac{\partial x^T}{x}=I$ ； ② $\frac{\partial {(Ax)}^T}{\partial x}=A^T$

4. 列向量 $y$ 对行向量 $x^T$ 求导：

注： $\times 1$ 矩阵对 $\times N$ 矩阵求导后变 $\times N$ 矩阵

$\frac{\partial y}{\partial x^T}=(\frac{\partial y^T}{\partial x})^T$

5. 向量积对列向量 $x$ 求导：

$\frac {\partial uv^T}{\partial x}=(\frac{\partial u}{\partial x})v^T+u(\frac{\partial v^T}{\partial x})$

$\frac {\partial vu^T}{\partial x}=(\frac{\partial u^T}{\partial x})v+u^T(\frac{\partial v^T}{\partial x})$

① $\frac {\partial (x^TA)}{\partial x}=(\frac{\partial x^T}{\partial x})A+x^T(\frac{\partial A}{\partial x})=IA+0x^T=A$ ；

② $\frac{\partial (Ax)}{\partial x^T}=[\frac{\partial (x^TA^T)}{\partial x}]^T=(A^T)^T=A$ ；

③ $\frac{\partial (x^TAx)}{\partial x}=(\frac{\partial x^T}{\partial x})Ax+[\frac{\partial (Ax)^T}{\partial x}]x=Ax+A^Tx$ ；

6. 矩阵 $Y$ 对列向量 $x$ 求导：

将 $Y$ 对 $x$ 的每个分量求偏导构成一个超向量（该向量每个元素都为一个矩阵）

$\frac{\begin{bmatrix} \partial y_{ij} \end{bmatrix}}{\partial \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix}}=\begin{bmatrix} \frac{\partial [y_{ij}]}{\partial x_1} \\ \frac{\partial [y_{ij}]}{\partial x_2}\\ \vdots \\ \frac{\partial [y_{ij}]}{\partial x_n}\end{bmatrix}$