矩阵求导

我来-我见-我征服

于 2019-03-02 22:43:41 发布

阅读量279

点赞数

文章标签：数学公式矩阵导数向量

本文链接：https://blog.csdn.net/m0_37771220/article/details/88082793

版权

本文介绍了矩阵求导的基本概念，包括纯量函数对向量和矩阵变量的导数定义，详细阐述了实际计算中矩阵微分的运算法则和迹的运算法则，并通过多个实例展示了如何进行矩阵导数的推导，如f=aTXb，f=aTexp(Xb)，以及f=tr(YTMY)，其中涉及向量、矩阵、指数函数和逐元素函数等的组合应用。

摘要由CSDN通过智能技术生成

纯量函数求导

最近看的文章涉及到矩阵求导，推导着就懵了。看了矩阵论和一些大牛的专栏、博客学习了一波，这里整理一下。

标量用小写字母表示
向量用粗体小写字母表示
矩阵用粗体大写字母表示

导数定义

1、纯量函数对向量变量的导数

设 $\boldsymbol{x}=(x_1, x_2, \cdots, x_n)^T$ 为向量变量， $y=f(\boldsymbol{x})=f(x_1, x_2, \cdots, x_n)$ 为可微的纯量函数，则纯量函数 $y=f(\boldsymbol{x})$ 对向量 $\boldsymbol{x}$ 的导数记为 $\frac{df}{d\boldsymbol{x}}$
$\frac{df}{d\boldsymbol{x}}=(\frac{\partial f}{\partial x_1}, \frac{\partial f}{\partial x_2}, \cdots ,\frac{\partial f}{\partial x_n})^T$
而纯量函数 $y=f(\boldsymbol{x})$ 对向量 $\boldsymbol{x}^T=(x_1,x_2,\cdots,x_n)$ 的导数记为
$\frac{df}{d\boldsymbol{x}^T}=(\frac{\partial f}{\partial x_1}, \frac{\partial f}{\partial x_2}, \cdots ,\frac{\partial f}{\partial x_n})$

纯量函数 $y=f(\boldsymbol{x})$ 是向量变量 $\boldsymbol{x}$ 各分量的函数

求导结果是和向量 $\boldsymbol{x}$ 同维数同形式的行或列向量

2、纯量函数对矩阵变量的导数

设 $\boldsymbol{X}=(x_{ij})_{m×n}\in R^{m×n}$ 为矩阵变量， $y=f(\boldsymbol{X})=f(x_{11}, x_{12},\cdots,x_{1n},x_{21}, x_{22}, \cdots, x_{2n},\cdots,x_{m1}, x_{m2},\cdots, x_{mn} )$ 为 $m n$ 元可微的纯量函数，则纯量函数 $y=f(\boldsymbol{X})$ 对矩阵变量 $\boldsymbol{X}$ 的导数记为 $\frac{df}{d\boldsymbol{X}}$