矩阵求导记录

最新推荐文章于 2024-08-21 16:53:31 发布

dongguyan8457

最新推荐文章于 2024-08-21 16:53:31 发布

阅读量131

点赞数

文章标签：数据结构与算法

原文链接：http://www.cnblogs.com/wyb6231266/p/11235204.html

版权

矩阵求导

在看多元线性回归的闭式解的时候遇到矩阵求导问题，总体来讲矩阵求导与函数求导有极大的相似性，查看wiki后记录下矩阵求导的一些性质，方面日后查看。

用到比较多的公式如下(分母布局)：
\[ \frac{\partial \boldsymbol A\boldsymbol x}{\partial \boldsymbol x}=A^T \]

\[ \frac{\partial \boldsymbol x^T\boldsymbol A}{\partial \boldsymbol x}=A \]

\[ \frac{\partial \boldsymbol u \cdot \boldsymbol v}{\partial \boldsymbol x}=\frac{\partial \boldsymbol u^T\boldsymbol v}{\partial \boldsymbol x}=\frac{\partial \boldsymbol u}{\partial \boldsymbol x}\boldsymbol v+\frac{\partial \boldsymbol v}{\partial \boldsymbol x}\boldsymbol u \]

证明几个公式：

1.$\cfrac{\partial \boldsymbol x^T\boldsymbol A \boldsymbol x}{\partial \boldsymbol x}=(\boldsymbol A+\boldsymbol A^T)\boldsymbol x$
\[ \begin{align} \frac{\partial \boldsymbol x^T\boldsymbol A \boldsymbol x}{\partial \boldsymbol x}=&\frac{\partial (\boldsymbol A^T \boldsymbol x)^T \boldsymbol x}{\partial \boldsymbol x}\ \\=&\frac{\partial \boldsymbol A^T \boldsymbol x}{\partial \boldsymbol x}\boldsymbol x+\frac{\partial \boldsymbol x}{\partial \boldsymbol x}\boldsymbol A^T \boldsymbol x\\ =&\boldsymbol A\boldsymbol x+\boldsymbol A^T\boldsymbol x\\ =&(\boldsymbol A+\boldsymbol A^T)\boldsymbol x \end{align} \]
2.$ \cfrac{\partial E_{\hat{\boldsymbol w}}}{\partial \hat{\boldsymbol w}}=2\mathbf{X}^T(\mathbf{X}\hat{\boldsymbol w}-\boldsymbol{y})$
\[ \begin{align} \cfrac{\partial E_{\hat{\boldsymbol w}}}{\partial \hat{\boldsymbol w}}=& \cfrac{\partial \boldsymbol{y}^T\boldsymbol{y}}{\partial \hat{\boldsymbol w}}-\cfrac{\partial \boldsymbol{y}^T\mathbf{X}\hat{\boldsymbol w}}{\partial \hat{\boldsymbol w}}-\cfrac{\partial \hat{\boldsymbol w}^T\mathbf{X}^T\boldsymbol{y}}{\partial \hat{\boldsymbol w}}+\cfrac{\partial \hat{\boldsymbol w}^T\mathbf{X}^T\mathbf{X}\hat{\boldsymbol w}}{\partial \hat{\boldsymbol w}}\\ =&0-(\boldsymbol{y}^T\mathbf{X})^T-\mathbf{X}^T\boldsymbol{y}+(\mathbf{X}^T\mathbf{X}+\mathbf{X}^T\mathbf{X})\hat{\boldsymbol w}\\ =&2\mathbf{X}^T(\mathbf{X}\hat{\boldsymbol w}-\boldsymbol{y}) \end{align} \]

参考文献：
https://en.wikipedia.org/wiki/Matrix_calculus#Scalar-by-vector_identities

转载于:https://www.cnblogs.com/wyb6231266/p/11235204.html

dongguyan8457

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
矩阵求导记录

矩阵求导在看多元线性回归的闭式解的时候遇到矩阵求导问题，总体来讲矩阵求导与函数求导有极大的相似性，查看wiki后记录下矩阵求导的一些性质，方面日后查看。用到比较多的公式如下(分母布局)：\[\frac{\partial \boldsymbol A\boldsymbol x}{\partial \boldsymbol x}=A^T\]\[\frac{\partial ...
复制链接

扫一扫