在机器学习的各种关于向量或者矩阵的求导中,经常会出现各种需要转置或者不需要转置的地方,经常会看得人晕头转向。今天我对机器学习中关于这部分的常识性处理方法进行整理并记录下来方便大家参考。
一些约定
首先,在机器学习中,对于研究经常需要用到的标量、向量、矩阵的求导,我们约定分子使用
表示, 分母使用
表示。其中,分子的标量形式为
,分子的向量形式表示为
,分子的矩阵形式表示为
;类似的,分母的标量形式为
,分母的向量形式表示为
,分母的矩阵形式表示为
。
根据上面的约定,我们研究一下五个分类(标号1-标号5对应后续标题)。如下:
上面的表格表示我们主要讨论的6个种类,对于矩阵对向量的求导
、向量对矩阵的求导