机器学习中矩阵向量求导

以下内容是根据刘建平的求导博客做的相关笔记

一、导数的定义与布局

1. 相关说明

在这里插入图片描述

2.导数布局

导数部分有分子布局分母布局两种情况。
分子布局和分母布局相差一个转置。

  • 标量对向量求导布局
    在这里插入图片描述
  • 向量对向量求导布局
    在这里插入图片描述
  • 求导布局总结
    在这里插入图片描述
  • 标量对向量或矩阵求导,以分母布局为主。向量对向量求导,以分母布局为主。

二、矩阵向量求导之定义法

写出单个元素间的求导关系,得出求导结果。
思路简单,适用于求解简单关系的导数

2.1 标量对向量求导

在这里插入图片描述

在这里插入图片描述

2.2 标量对矩阵求导

在这里插入图片描述

2.3 向量对向量求导

在这里插入图片描述

三、矩阵向量求导之微分法

3.1 矩阵微分

在这里插入图片描述

3.2 矩阵微分的性质

矩阵迹相关
在这里插入图片描述
在这里插入图片描述
A ∗ A ∗ = ∣ A ∣ A*A^{*}=\left|A\right| AA=A
A ∗ = ∣ A ∣ A − 1 A^{*}=\left|A\right|A^{-1} A=AA1
A ∗ A^{*} A A A A的伴随矩阵, A A A相应位置的代数余子式构成的矩阵

3.3使用微分法求解矩阵向量求导

在这里插入图片描述
在这里插入图片描述
d ( t r ( X ) ) = t r ( d ( x ) ) d(tr(X))=tr(d(x)) d(tr(X))=tr(d(x))
( u v ) ′ = u ′ v + u v ′ (uv)^{'}=u^{'}v+uv^{'} (uv)=uv+uv

四、链式法则

4.1 链式法则与矩阵相容

链式关系成立的条件是,相互关联的变量都是向量。
在这里插入图片描述
x \bm{x} x y \bm{y} y, z \bm{z} z都是向量时,用上面的链式法则公式直接求解。
当最终的变量是标量时,按上面公式计算会出现维度不相容的情况。需要按下面的方法计算:
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值