1、标量关于标量 x 的求导:
|
2、向量关于标量 x 的求导:
定义向量 Y:
|
向量 Y 关于标量 x 的导数就是 Y 的每个元素分别对 x 进行求导,于是可以得到:
|
此时,导数是 Y 向量的正切向量。
2、矩阵 Y 关于标量 x 的求导:
矩阵对标量的求导类似于向量关于标量的求导,也就是矩阵的每个元素分别对标量 x 的求导,可以得到:
|
3、向量求导:
3.1、标量关于向量求导:
定义标量 y 关于 x 的向量为:
|
对向量 x 关于标量 y 的导数为:
|
此时的向量为:梯度向量。导数为标量 y 在空间 R^n 的梯度,该空间以 x 为基。
3.2、向量关于向量求导:
向量函数 y ,关于向量 x 的导数即为:
|
此时矩阵向量叫做:Jacobian矩阵。
3.3、矩阵关于向量求导:
定义矩阵 Y 为:
|
向量 x 为:
|
所以矩阵 y 关于向量 x 的导数为:
|
4、矩阵求导:
我们一般只考虑标量关于矩阵的导数,即标量 y 关于矩阵 x 的导数,此时的导数矩阵是梯度矩阵:
|
5、机器学习中常见的矩阵求导的形式:
|
|
|
6、迹相关的公式:
|
|
|
|
|
|
参考:
[1]. 斯坦福大学——吴恩达机器学习
[2]. Python机器学习算法
[3]. 深入浅出深度学习——原理剖析于Python实践,黄安阜