神经网络反向传播时的梯度到底怎么求, 注意与下图矩阵求导的本质的区分:神经网络的在反向传播过程中,矩阵(m×n)对矩阵(p×q)求导的结果是只列出对相关元素求偏导的结果,其他不相关的元素根本就没有对应的偏导,所以求得的偏导矩阵元素的个数也不等同于m×n×p×q的个数!!!
还要注意的是,矩阵除法没有被定义,只有乘逆矩阵的操作
1.用好维度分析,不要直接求导
2.用好链式法则,不要一步到位
https://zhuanlan.zhihu.com/p/25202034
矩阵求导(分母布局与分子布局),以及常用的矩阵求导公式:
https://blog.csdn.net/xingzhe123456789000/article/details/107224247