梯度向量、Jacobian、Hessian矩阵

最新推荐文章于 2024-08-30 10:58:16 发布

Alinoo

最新推荐文章于 2024-08-30 10:58:16 发布

阅读量5.1k

点赞数 4

分类专栏：理论回顾文章标签：矩阵深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/clwdzxc1992/article/details/107288213

版权

理论回顾专栏收录该内容

2 篇文章 0 订阅

订阅专栏

目录

一、梯度向量
- 定义
二、Jacobian矩阵
- 定义
- 举例
三、Hessian矩阵
- 定义
- 举例
四、梯度向量、Jacobian、Hessian的对比

【一句话引入】海森矩阵相当于 f(x1,x2,…,xn) 的梯度向量 g(x) 关于自变量 (x1,x2,…,xn) 的雅可比矩阵。

一、梯度向量

定义

目标函数f为单变量，是关于自变量x=(x1,x2,…,xn)T的函数，单变量函数f对向量x求梯度，结果为一个与向量x同维度的向量，称之为梯度向量：
在这里插入图片描述

二、Jacobian矩阵

雅可比矩阵的重要性在于它体现了一个可微方程与给出点的最优线性逼近. 因此, 雅可比矩阵类似于多元函数的导数。

定义

假设F: Rn→Rm是一个从欧式n维空间转换到欧式m维空间的函数. 这个函数由m个实函数组成:
在这里插入图片描述
这些函数的一阶偏导数(如果存在)可以组成一个m行n列的矩阵, 这就是所谓的雅可比矩阵：

此矩阵用符号表示为：

举例

在这里插入图片描述

三、Hessian矩阵

定义

在数学中, 海森矩阵(Hessian matrix或Hessian)是一个自变量为向量的实值函数的二阶偏导数组成的n*n方块矩阵, 此函数如下：

如果f的所有二阶导数都存在, 那么f的海森矩阵即：
在这里插入图片描述
其中x=(x1,x2…,xn), 即H(f)为：

简单可以看成f在对每个x1,x2…,xn求一阶偏导构成的n个实函数，再求这n个实函数的雅可比矩阵。
实际上，Hessian矩阵是梯度向量g(x)对自变量x(x1,x2…xn)的Jacobian矩阵

举例

在这里插入图片描述

四、梯度向量、Jacobian、Hessian的对比

A. 一元函数

自变量（一元）：x = x
因变量：f(x)
- 一阶导数：f关于自变量（一元）的一阶导数为f’(x)
- 二阶导数：f关于自变量（一元）的一阶导数为f’’(x)

B. 多元函数

自变量（多元）：
因变量有两种情况：
- 单个实函数
  - 梯度向量：f关于自变量（多元）的一阶导数构成的向量为梯度向量g(x)
  - Hessian矩阵：f关于自变量（多元）的二阶导数构成的矩阵为海森矩阵H
- 多个实函数
  - Jacobian矩阵：f关于自变量的一阶导数构成的矩阵为雅可比矩阵J

关注

4
点赞
踩
29

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Alinoo CSDN认证博客专家 CSDN认证企业博客

码龄7年

2: 原创

34万+: 周排名

115万+: 总排名

5962: 访问

: 等级

82: 积分

5: 粉丝

4: 获赞

2: 评论

31: 收藏

私信

关注

热门文章

分类专栏

理论回顾 2篇

最新评论

梯度下降、牛顿法
Alinoo:
梯度下降、牛顿法
陈金猪: 写得不错，但字有点丑

最新文章

梯度下降、牛顿法

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。