矩阵向量求导之微分法

允许一部分码农先富起来

已于 2023-07-31 09:44:25 修改

阅读量75

点赞数

文章标签：前端深度学习矩阵

于 2023-07-20 14:50:53 首次发布

本文链接：https://blog.csdn.net/hahaha232323/article/details/118553905

版权

矩阵向量求导之微分法

标量微分

$\frac {\partial f}{\partial x} dx$

向量微分

$\displaystyle\sum_{i=1}^n\frac{\partial f}{x_i}dx_i= \begin{bmatrix} \frac{\partial f}{x_1}\\ \\ \frac{\partial f}{x_2}\\ \\ \frac{\partial f}{x_3}\\ .\\ .\\ .\\ \\ \frac{\partial f}{x_n}\\ \end{bmatrix} \begin{bmatrix} d_{x1}&d_{x2}&d_{x3}&....&d_{x1}\end{bmatrix} =\begin{pmatrix}\frac {\partial f}{\partial \Large x} \end{pmatrix}^Td\Large x$

矩阵微分

$\displaystyle\sum_{i=1}^m\displaystyle\sum_{j=1}^n\frac {\partial f}{\partial \LARGE x_{ij}}d\LARGE X_{ij}$
$\begin{bmatrix} \frac{\partial f}{x_{11}}&\frac{\partial f}{x_{21}}&\frac{\partial f}{x_{31}}&...&{x_{m1}}\\ \\ \frac{\partial f}{x_{12}} &\frac{\partial f}{x_{22}}&\frac{\partial f}{x_{32}}&...&{x_{m2}}\\ .\\ .\\ .\\ \frac{\partial f}{x_{1n}}&\frac{\partial f}{x_{2n}}&\frac{\partial f}{x_{3n}}&...&{x_{mn}}\\ \end{bmatrix} \begin{bmatrix} dx_{11}&dx_{12}&dx_{13}&...&dx_{1n}\\ \\ dx_{21}&dx_{22}&dx_{23}&...&dx_{2n}\\ .\\ .\\ .\\ dx_{m1}&dx_{m2}&dx_{m3}&...&dx_{mn}\\ \end{bmatrix} = \begin{bmatrix} \frac{\partial f}{x_{11}}dx_{11}+ \frac{\partial f}{x_{21}}dx_{21}+ \frac{\partial f}{x_{31}}dx_{31}+ . . . + \frac{\partial f}{x_{m1}}dx_{m1} & \frac{\partial f}{x_{11}}dx_{12}+ \frac{\partial f}{x_{21}}dx_{22}+ \frac{\partial f}{x_{31}}dx_{32}+ . . . + \frac{\partial f}{x_{m1}}dx_{m2} & \frac{\partial f}{x_{11}}dx_{13}+ \frac{\partial f}{x_{21}}dx_{23}+ \frac{\partial f}{x_{31}}dx_{33}+ . . . + \frac{\partial f}{x_{m1}}dx_{m3}&...& \frac{\partial f}{x_{11}}dx_{1n}+ \frac{\partial f}{x_{21}}dx_{2n}+ \frac{\partial f}{x_{31}}dx_{3n}+ . . . + \frac{\partial f}{x_{m1}}dx_{mn}\\ \\ \frac{\partial f}{x_{12}}dx_{11}+ \frac{\partial f}{x_{22}}dx_{21}+ \frac{\partial f}{x_{32}}dx_{31}+ . . . + \frac{\partial f}{x_{m2}}dx_{m1} & \frac{\partial f}{x_{12}}dx_{12}+ \frac{\partial f}{x_{22}}dx_{21}+ \frac{\partial f}{x_{32}}dx_{32}+ . . . + \frac{\partial f}{x_{m2}}dx_{m2}& \frac{\partial f}{x_{12}}dx_{13}+ \frac{\partial f}{x_{22}}dx_{23}+ \frac{\partial f}{x_{32}}dx_{33}+ . . . + \frac{\partial f}{x_{m2}}dx_{m3}&...& \frac{\partial f}{x_{12}}dx_{1n}+ \frac{\partial f}{x_{22}}dx_{2n}+ \frac{\partial f}{x_{32}}dx_{3n}+ . . . + \frac{\partial f}{x_{m2}}dx_{mn}\\ .\\ .\\ .\\ \frac{\partial f}{x_{1n}}dx_{11}+ \frac{\partial f}{x_{2n}}dx_{21}+ \frac{\partial f}{x_{3n}}dx_{31}+ . . . + \frac{\partial f}{x_{mn}}dx_{m1}& \frac{\partial f}{x_{1n}}dx_{12}+ \frac{\partial f}{x_{2n}}dx_{22}+ \frac{\partial f}{x_{3n}}dx_{32}+ . . . + \frac{\partial f}{x_{mn}}dx_{m2}& \frac{\partial f}{x_{1n}}dx_{13}+ \frac{\partial f}{x_{2n}}dx_{23}+ \frac{\partial f}{x_{3n}}dx_{33}+ . . . + \frac{\partial f}{x_{mn}}dx_{m3}&...& \frac{\partial f}{x_{1n}}dx_{1n}+ \frac{\partial f}{x_{2n}}dx_{2n}+ \frac{\partial f}{x_{3n}}dx_{3n}+ . . . + \frac{\partial f}{x_{mn}}dx_{mn} \end{bmatrix}$
所以矩阵的微分可以表示为
$tr\begin{pmatrix} \begin{pmatrix} \frac {\partial f}{\partial \Large X} \end{pmatrix}^Td\Large x \end{pmatrix}$
向量微分也可以用矩阵微分来表示
$\begin{pmatrix} \begin{pmatrix} \frac{\partial f}{\partial \Large x} \end{pmatrix}^T d\Large x \end{pmatrix}$

矩阵微分的性质

我们在讨论如何使用矩阵微分来求导前，先看看矩阵微分的性质
$d\begin{pmatrix} \LARGE X + \LARGE Y \end{pmatrix}= d \LARGE Y + d \LARGE {X} , d\begin{pmatrix} \LARGE X - \LARGE Y \end {pmatrix}= d\LARGE X - d\LARGE Y$
$\LARGE d\begin{pmatrix} \LARGE X \LARGE Y \end{pmatrix} =\LARGE X \LARGE d\begin{pmatrix} \LARGE Y \end{pmatrix}+ \LARGE Y \LARGE d \begin{pmatrix} \LARGE X \end{pmatrix}$

$\begin{pmatrix} \LARGE X^T \end{pmatrix}= \begin{pmatrix} \LARGE {dX} \end{pmatrix}^T$
$\begin{pmatrix} \LARGE X \end{pmatrix}=tr \begin{pmatrix} \LARGE {dX} \end{pmatrix}$

$\begin{pmatrix} \LARGE X \normalsize \bigodot \LARGE Y \end{pmatrix}=\LARGE X \normalsize \bigodot d \begin{pmatrix} \LARGE Y \end{pmatrix} +\LARGE Y \normalsize \bigodot d \begin{pmatrix} \LARGE X \end{pmatrix}$