一、基础定义
对于 的计算结果,根据y和x的维度,可根据下图得到导数的维度
图1. 矩阵求导结果维度图
例子:
对于函数:
此时 y 是标量,自变量为矩阵
对自变量求导数
注意到 y 为标量,x 为向量时,求得导数需要进行转置,反之则不用。
求导样例如下:
图2. 求导样例
二、结论推导
以下是根据个人理解对图2 中一些样例的推导:
2.1 第一排第三个结论证明
2.2 第一排第四个结论证明
2.3 第二排第三个结论证明
这里用黑体严格区分张量与标量
对于 的计算结果,根据y和x的维度,可根据下图得到导数的维度
图1. 矩阵求导结果维度图
例子:
对于函数:
此时 y 是标量,自变量为矩阵
对自变量求导数
注意到 y 为标量,x 为向量时,求得导数需要进行转置,反之则不用。
求导样例如下:
图2. 求导样例
以下是根据个人理解对图2 中一些样例的推导:
这里用黑体严格区分张量与标量