矩阵求导术(二)—— 矩阵对矩阵的求导
接上篇,继续讨论涉及矩阵的求导技术。其实总结下来,涉及矩阵的求导本质就是多个标量对标量的求导按照某种规则排列起来,而这样的排列符合许多微分、线性代数的运算法则,由此衍生出的运算规则可以简化矩阵微分运算过程的表达形式,进而提升求导效率。
参考资料
另外,张贤达《矩阵分析与应用》也有对矩阵微分的详细论述,可做参考。
-
向量对向量的求导
首先定义向量对向量的导数。注意,这里没有特别限定是列向量还是行向量,因为最终的理论都是要将导函数和自变量都列向量化。对于p×1列向量,m×1列向量,其导数定义为: