【机器学习课程】向量和矩阵微积分

最新推荐文章于 2024-08-06 22:27:00 发布

洌泉_就这样吧

最新推荐文章于 2024-08-06 22:27:00 发布

阅读量327

点赞数 1

分类专栏：机器学习课程 by Xia Hong 机器学习

本文链接：https://blog.csdn.net/baidu_35231778/article/details/117296821

版权

机器学习同时被 2 个专栏收录

15 篇文章 2 订阅

订阅专栏

机器学习课程 by Xia Hong

5 篇文章 0 订阅

订阅专栏

在神经网络中，经常遇到一系列变量分析问题
向量和矩阵微积分是单个变量微积分的延申

1 向量梯度

向量梯度：令 $\bold w})$ 为一个m个变量的可微数值函数，其中 $\bold w}=[w_1,\dots,w_m]^T$
由此可以得到 $\bold w})$ 的梯度，采用g的偏微分形式：
${\nabla g}=\frac{\partial g}{\partial \bold w}= \left(\begin{matrix} \frac{\partial g}{\partial w_1} \\ \vdots \\ \frac{\partial g}{\partial w_m} \end{matrix} \right)$

相似的，可以定义二阶梯度矩阵或Hessian矩阵：
$\frac{\partial^2 g}{\partial \bold w^2}=\left( \begin{matrix} \frac{\partial^2 g}{\partial w_1^2} & \cdots & \frac{\partial^2 g}{\partial w_1w_m} \\ \vdots & \ddots & \vdots \\ \frac{\partial^2 g}{\partial w_mw_1} & \cdots & \frac{\partial^2 g}{\partial w_m^2} \end{matrix}\right)$

将向量值函数进行推广，得到

$g(\bold w)=[g_1(\bold w),\cdots,g_n(\bold w)]^T$

从而得到Jacobian矩阵的定义：

$\frac{\partial g}{\partial \bold w}=\left( \begin{matrix} \frac{\partial g}{\partial w_1} & \cdots & \frac{\partial g_n}{\partial w_1} \\ \vdots & \ddots & \vdots \\ \frac{\partial g_1}{\partial w_m} & \cdots & \frac{\partial g_n}{\partial w_m} \end{matrix}\right)$

在向量转化中，Jacobian矩阵的列向量是对应的分量函数 $g_i({\bold w})$ 的梯度

2 微分公式

常用的微分公式为：

${\frac{\partial f(\bold w)g(\bold w)}{\partial \bold w} = \frac{\partial f(\bold w) }{\partial \bold w}g(\bold w)+f(\bold w)\frac{\partial g(\bold w) }{\partial \bold w} }\tag{1}$

$\frac{\partial f(\bold w)/g(\bold w)}{\partial \bold w} = \frac{\frac{\partial f(\bold w) }{\partial \bold w}g(\bold w)-f(\bold w)\frac{\partial g(\bold w) }{\partial \bold w}}{g^2(\bold w)} \tag{2}$