微分和导数(一)

本文介绍了微分、导数、偏导数的概念,探讨了它们在描述函数变化和深度学习中的应用,包括导数的几何意义、梯度的定义以及链式法则在复合函数微分中的作用。
摘要由CSDN通过智能技术生成

1.微分:

假设我们有⼀个函数f : R → R,其输⼊和输出都是标量。如果f的导数存在,这个极限被定义为
在这里插入图片描述
如果f′(a)存在,则称f在a处是可微的。如果f在⼀个区间内的每个数上都是可微的,则此函数在此区间中是可微的。导数f′(x)解释为f(x)相对于x的瞬时变化率。所谓的瞬时变化率是基于x中的变化h,且h接近0。

给定y = f(x),其中x和y分别是函数f的⾃变量和因变量。以下表达式是等价的:
在这里插入图片描述

2.偏导数:

设y = f(x1, x2, . . . , xn)是⼀个具有n个变量的函数。y关于第i个参数xi的偏导数为:
在这里插入图片描述
对于偏导数的表⽰,以下是等价的:
在这里插入图片描述

3.导数和微分的理解:

导数是描述函数变化的快慢,微分是描述函数变化的程度。

导数是比值,微分是增量。

导数是函数的局部性质,一个函数在某一点的导数描述了这个函数在这一点附近的变化率。微分是一个函数表达式,用于自变量产生微小变化时计算因变量的近似值。

导数是针对一个自变量的,微分是针对所有自变量的,多元函数的导数是指多元函数的偏导数,它是指在多元函数中,每个变量的偏导数的集合。

导数的几何意义是该函数曲线在这一点上的切线斜率。

微分的几何意义是用局部切线段近似代替曲线段,即非线性函数局部线性化。

4.梯度:

梯度是⼀个向量,其分量是多变量函数相对于其所有变量的偏导数。
设函数f : Rn → R的输⼊是⼀个n维向量x = [x1, x2, . . . , xn]⊤,并且输出是⼀个标量。函数f(x)相对于x的梯度是⼀个包含n个偏导数的向量:
在这里插入图片描述

5.链式法则:

在深度学习中,多元函数通常是复合(composite)的,所以微分这些函数比较难,链式法则可以被⽤来微分复合函数。
假设函数y = f(u)和u = g(x)都是可微的,根据链式法则:
在这里插入图片描述
假设可微分函数y有变量u1, u2, . . . , um,其中每个可微分函数ui都有变量x1, x2, . . . , xn,根据链式法则:
在这里插入图片描述

  • 6
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值