首先矩阵求导(向量是其中一个特例而已)的东西很多都会有让人产生错觉的,如果要想要好好深入研究就要从矩阵代数(matrix alegbra)下手, 比如
不过作为应用来讲的话,其实你需要只是一个cookbook,比如
说说个人的想法
1。矩阵求导比较麻烦,所以尽量不要使用最基本的公式,要找公式就找具体的,形式完全一致的公式,直接带入(比如cookbook中就有各种具体形式的求导公式),除非你熟悉从头开始的各种的推倒原理以及各种符号意义。
2。d(UV) = d(U)V + Ud(V),这种公式不是没有用,只是相对来讲在矩阵代数中,更重要的是看清对谁求导,所以
或者
这一类的公式更实用,而且不容易带入出错,若是要用d(UV) = d(U)V + Ud(V)的也必须要带着dx啊。另外,这里之所以说要明确分母部分的内容,不光是为了确定这个变量是x,而不是y,更重要的是明确求导的变量的类型,因为各种情况差别巨大对标量求导
1)向量对标量求导,结果是个向量
事实上就是向量的每一个元素对标量求导。举个例子,对于
,其中
是个标量,