前言:
主要参考 https://www.cnblogs.com/pinard/p/10750718.html。
目录
- 向量概念
- 求导类型
- 求导规则
一 向量概念
列向量是一个 n×1 的矩阵,即矩阵由一个含有n个元素的列所组成:
列向量的转置是一个行向量
sx: 标量
x: n维向列量
X: m*n矩阵
sy: 标量
y: m维向列量
Y: m*n 矩阵
二 求导的类型
sy | y | Y | |
sx | |||
x | |||
X |
三 求导规则
最基本的求导布局有两个:分子布局(numerator layout)和分母布局(denominator layout )。
默认的布局:
向量或者矩阵对标量求导,则使用分子布局为准,
如果是标量对向量或者矩阵求导,则以分母布局为准。
例:
1 向量对标量的求导
假设y为m维列向量,求导结果也是m维列向量
2 标量对矩阵求导
X是m*n 的矩阵
分母布局 也是m*n的矩阵
分子布局: n*m的矩阵
3 向量对向量的求导
分子布局: m*n的矩阵
分母布局:n*m的矩阵,上面的转置矩阵