引用 闲话矩阵求导由于github地址找不着该文件了,深表遗憾,以下是百度网盘,需要的可以下载pdf版本的,侵删。
百度网盘 提取码:viln
请看完文章再来回头理解下面的话:
上面有一句话值得注意:事实上,直观上看,凡是对标量求导,结果的形式都要转置,而标量对向量和矩阵求导则位置保持不动。
再来看向量对向量求导过程中:
这便不难理解,对于结果的第一行来说,我们可以认为x1为标量,yi为向量,得出的结果转置了,
在接下来的很多推导过程中,包括矩阵求导的链式运算都是根据维度来确定哪些需要转置,哪些不需要转置,这些都是非精准的求导法则。
强烈建议读完这本书,非常棒!
下面是theta的推导过程: