标量、向量、矩阵微积分

首先引入三个重要概念
1、分子布局(Numerator-layout notation)
2、分母布局(Denominator-layout notation)
3、混合布局(Mixed layout)

接下来我们会对这三个概念进行深入了解。

一、布局公约

当我们在探究机器学习、深度学习时,时常会遇到标量与向量,向量与矩阵等之间的微分,求其导数或梯度。但我们需要知道,不同的作者或上课的教授会使用不同的布局对导数的结果进行表示,所以我们经常会看到不同源的导数和梯度看起来大致相同,但维度总是不一致,那是因为他们用了不同的布局;再者,即便同一个作者,对不同类型的公式进行描述时,为了方便,可能也会使用不同的布局来进行表示,因此我们需要非常小心地理解其背后的表示方法,才不会被困扰。

二、向量对向量求导,结果为矩阵

∂ y ∂ x \frac{\partial y}{\partial x} xy为例(都是向量)

简而言之,
分子布局 y y y x T x^T xT来表示结果。
分母布局 y T y^T yT x x x来表示结果。
混合布局分子布局一样,同样以 y y y x T x^T xT来表示结果,但不同的是它会把 x T x^T xT直接表示在 ∂ y ∂ x \frac{\partial y}{\partial x} xy上,变成 ∂ y ∂ x T \frac{\partial y}{\partial x^T} xTy

举例:
如果 y y y是m维度的列向量,维度表示为(m,1); x x x是n维度的列向量,表示为(n,1)。

按照分子布局 y y y仍然是(m,1),纵向排开,而 x T x^T xT变成(1,n),横向排开,则 ∂ y ∂ x \frac{\partial y}{\partial x} xy最终维度为(m,n),m为纵向维度,n为横向维度。

按照分母布局 y T y^T yT变成(1,m),横向排开,而 x x x仍然是(n,1),纵向排开,则 ∂ y ∂ x \frac{\partial y}{\partial x} xy最终维度为(n,m),n为纵向维度,m为横向维度。

按照混合布局,最终结果仍然是(m,n)维度。

三、其他资料

在这里插入图片描述
图片来源

如下是按分子布局来计算维度
在这里插入图片描述

图片来源

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值