面对那么多公式,即使公式摆在眼前,也会给人一种眼花缭乱的感觉。百度文库中将这些情况全部列举了出来。我在阅读公式的时候,心里想:可不可以将他们最终都归结到一个原则上,这样无论情况有多么复杂,都可以思路清晰的给出计算方法,而不用现去查阅资料,并且还会永远记住,生硬的套公式虽然可以解决问题,但体验总是不好。
为什么会感觉复杂?就是因为函数和变量涉及到的元素多,结构略微复杂,在有些情况下变量中各个元素的位置和最终的求导结果中相对应元素的位置相比会发生改变,例如变量的各个分量元素在原来的数据结构中是排列为一列,可是最终求完导数后却在导数结果的数据结构中呈现行排列。
根据元素(函数)对列向量(变量)求导得到的还是列向量,并且变量列向量每个元素的与在结果向量中的排列一致,都是自上而下:
在观察列向量(函数)对列向量(变量)求导,发现转化成了上边的规律,转化成函数中的每个元素对变量列向量求导,并排列为一列,从这里可以感觉到变量列向量的元素位置排列计算前后似乎具有不变性的特点打住!!:真正的结果没有一直展开成一个无比长的列向量,而是展开成一个矩阵,列向量(变量)中的元素在最终输出结果中呈现横向排列,和输入时候相比发生了改变,并且该结果还有一个著名的名字,叫Jacobin矩阵,注意:列向量对列向量求导与列向量对行向量求导的结果相同,到这里我们知道了Jacobin矩阵是两个列向量或者列向量对行向量求导产生的。那么是不是可以理解为向量间求导运算最终结果的结构其实是向着一个结构比较均匀的方向靠拢呢?
在来观察一个行向量(函数)对列向量(变量)求导,最终结果是一个矩阵,但是结果中所涉及的列向量的元素仍然是按照其在列向量(变量)中的排列方式:
最后之一,就是矩阵(函数)对列向量(变量)求导 ,可以很自然而然的将矩阵看做一个元素,因此转化为元素对列向量的求导,元素对列向量的求导没有介绍,但是过程也很直观,就是元素对列向量中的每个元素求导,然后结果的排列顺序和列向量的排列顺序相同。进一步,对于元素对每个列向量中的元素求导,有可以转化为矩阵对元素求导,这个过程也很直观:
最后,矩阵(函数)对矩阵(变量)求导 ,先后经历了从矩阵对元素的转化以及元素对矩阵的转化:
这里主要涉及的对象其实是列向量,主要是列向量的表达比较常见,所谓“列体制”!