梯度向量、Jacobian、Hessian矩阵


【一句话引入】海森矩阵相当于 f(x1,x2,…,xn) 的梯度向量 g(x) 关于自变量 (x1,x2,…,xn) 的雅可比矩阵。

一、梯度向量

定义

目标函数f为单变量,是关于自变量x=(x1,x2,…,xn)T的函数,单变量函数f对向量x求梯度,结果为一个与向量x同维度的向量,称之为梯度向量:
在这里插入图片描述

二、Jacobian矩阵

雅可比矩阵的重要性在于它体现了一个可微方程与给出点的最优线性逼近. 因此, 雅可比矩阵类似于多元函数的导数。

定义

假设F: Rn→Rm是一个从欧式n维空间转换到欧式m维空间的函数. 这个函数由m个实函数组成:
在这里插入图片描述
这些函数的一阶偏导数(如果存在)可以组成一个m行n列的矩阵, 这就是所谓的雅可比矩阵:
在这里插入图片描述
此矩阵用符号表示为:
在这里插入图片描述

举例

在这里插入图片描述

三、Hessian矩阵

定义

在数学中, 海森矩阵(Hessian matrix或Hessian)是一个自变量为向量的实值函数的二阶偏导数组成的n*n方块矩阵, 此函数如下:

如果f的所有二阶导数都存在, 那么f的海森矩阵即:
在这里插入图片描述
其中x=(x1,x2…,xn), 即H(f)为:
在这里插入图片描述
简单可以看成f在对每个x1,x2…,xn求一阶偏导构成的n个实函数,再求这n个实函数的雅可比矩阵。
实际上,Hessian矩阵是梯度向量g(x)对自变量x(x1,x2…xn)的Jacobian矩阵
在这里插入图片描述

举例

在这里插入图片描述在这里插入图片描述

四、梯度向量、Jacobian、Hessian的对比

A. 一元函数

  • 自变量(一元):x = x
  • 因变量:f(x)
    • 一阶导数:f关于自变量(一元)的一阶导数为f’(x)
    • 二阶导数:f关于自变量(一元)的一阶导数为f’’(x)

B. 多元函数

  • 自变量(多元):
    在这里插入图片描述
  • 因变量有两种情况:
    • 单个实函数
      在这里插入图片描述
      • 梯度向量:f关于自变量(多元)的一阶导数构成的向量为梯度向量g(x)
      • Hessian矩阵:f关于自变量(多元)的二阶导数构成的矩阵为海森矩阵H
    • 多个实函数
      在这里插入图片描述
      • Jacobian矩阵:f关于自变量的一阶导数构成的矩阵为雅可比矩阵J
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值