【Datawhale组队学习】机器学习数学基础 - 一元函数微分学【Task 03】

导数的概念

y = f ( x ) y = f(x) y=f(x)在变量 x = x 0 x = x_0 x=x0处存在一个增量 Δ x \Delta x Δx(可正可负),则可以得到函数的增量 Δ y = f ( x 0 + Δ x ) − f ( x 0 ) \Delta y = f(x_0 + \Delta x) - f(x_0) Δy=f(x0+Δx)f(x0)

若函数增量 Δ y \Delta y Δy,与自变量增量 Δ x \Delta x Δx的比值在 Δ x → 0 \Delta x \rightarrow 0 Δx0时极限存在,即 lim ⁡ Δ x → 0 Δ y Δ x \lim_{\Delta x \rightarrow 0}\frac{\Delta y}{\Delta x} limΔx0ΔxΔy存在,则说明函数 y = f ( x ) y = f(x) y=f(x) x = x 0 x = x_0 x=x0处可导,称极限值为 x 0 x_0 x0处的导数,记为:
f ′ ( x 0 ) = lim ⁡ Δ x → 0 Δ y Δ x = lim ⁡ Δ x → 0 f ( x 0 + Δ x ) − f ( x 0 ) Δ x f'(x_0) = \lim_{\Delta x \rightarrow 0}\frac{\Delta y}{\Delta x} = \lim_{\Delta x \rightarrow 0}\frac{f(x_0 + \Delta x) - f(x_0)}{\Delta x} f(x0)=Δx0limΔxΔy=Δx0limΔxf(x0+Δx)f(x0)

整理笔记所用,定义并不完整。

理解:某点的导数,本质上可以看做函数在该点处增量的极限值
由此可以看出,若需要证明某点 x 0 x_0 x0导数存在,那么根据导数本质是极限的原理,仅需证明在 x = x 0 x = x_0 x=x0处导数左右极限均相等。

以上定义中,令 x = x 0 + Δ x x = x_0 + \Delta x x=x0+Δx,那么导数的定义还可以表示为:
f ′ ( x 0 ) = lim ⁡ x → x 0 f ( x ) − f ( x 0 ) x − x 0 f'(x_0) = \lim_{x \rightarrow x_0}\frac{f(x) - f(x_0)}{x - x_0} f(x0)=xx0limxx0f(x)f(x0)

几何定义

y在点 x 0 x_0 x0处的导数值 f ′ ( x 0 ) f'(x_0) f(x0)导数值,就是曲线 y = f ( x ) y = f(x) y=f(x)在点 ( x 0 , y 0 ) (x_0,y_0) (x0,y0)处切线的斜率 k k k。由此可以得出切线和法线公式:

切 线 : y − y 0 = f ′ ( x 0 ) ( x − x 0 ) 法 线 : y − y 0 = − 1 f ′ ( x 0 ) ( x − x 0 ) , f ( x 0 ) ≠ 0 切线:y - y_0 = f'(x_0)(x - x_0) \atop 法线:y - y_0 = -\frac{1}{f'(x_0)}(x - x_0) \quad ,f(x_0) \neq 0 线yy0=f(x0)1(xx0),f(x0)=0线yy0=f(x0)(xx0)

高阶函数

f ( n ) ( x 0 ) = lim ⁡ Δ x → 0 f ( n − 1 ) ( x 0 + Δ x ) − f ( n − 1 ) ( x 0 ) Δ x f^{(n)}(x_0) = \lim_{\Delta x \rightarrow 0} \frac{f^{(n-1)}(x_0 + \Delta x) - f^{(n-1)}(x_0)}{\Delta x} f(n)(x0)=Δx0limΔxf(n1)(x0+Δx)f(n1)(x0)

高阶导数的概念其实就是在前一阶导数的基础上再次求导。

微分的概念

导数的概念是可以由路程、时间和速度的关系引入,而微分可以通过正方形边长与面积的关系引入,可以参考《张宇数学基础30讲》56页的引例

设函数 y = f ( x ) y = f(x) y=f(x)在点 x 0 x_0 x0处,对于自变量增量 Δ x \Delta x Δx,有函数增量 Δ y = f ( x 0 + Δ x ) − f ( x 0 ) \Delta y = f(x_0 + \Delta x) - f(x_0) Δy=f(x0+Δx)f(x0),若存在与 Δ x \Delta x Δx无关的常数A,使得
Δ y = A Δ x + o ( Δ x ) \Delta y = A\Delta x + o(\Delta x) Δy=AΔx+o(Δx)
那么称 f ( x ) f(x) f(x)在点 x 0 x_0 x0处可微,并称 A Δ x A \Delta x AΔx为f(x)在点 x 0 x_0 x0处的微分,记为 d y ∣ x = x 0 = A Δ x dy|_{x = x_0} = A \Delta x dyx=x0=AΔx,又 Δ x = d x \Delta x = dx Δx=dx,故 d y ∣ x = x 0 = A d x dy|_{x = x_0} = A dx dyx=x0=Adx

A A A实际上是 f ( x ) f(x) f(x) x = x 0 x = x_0 x=x0处的导数,由此可以转化为如下定义:

d y = f ′ ( x ) d x ⇒ d y d x = f ′ ( x ) dy = f'(x)dx \quad \Rightarrow \quad \frac{dy}{dx} = f'(x) dy=f(x)dxdxdy=f(x)

针对右式的除法,可以有两种解释

  • 从导数的观点看, d y d x \frac{dy}{dx} dxdy是一个表示导数的符号,
  • 从微分的观点看, d y d x \frac{dy}{dx} dxdy确实是一个除法,也叫微商

微分与导数

微分实际上是使用一个线性增量 A Δ X A \Delta X AΔX来代替复杂的增量 Δ y \Delta y Δy,其误差为 Δ y − A Δ x \Delta y - A \Delta x ΔyAΔx,即 o ( Δ x ) o(\Delta x) o(Δx),可以忽略不计。

所以在一元函数中,导数与微分的概念类似,f(x)在 x 0 x_0 x0处可微与可导互为充要条件,那么判断可微的题目,即可转换为判断可导进行证明。

几何定义

与导数表示斜率不同。

f(x)在 x = x 0 x = x_0 x=x0处的可微,则在点 ( x 0 , y 0 ) (x_0,y_0) (x0,y0)附近可以用切线段近似代替曲线段。

导数与微分的计算

下面主要是关于计算的一些性质和技巧

四则运算

  1. 和差的导数: [ u ( x ) ± v ( x ) ] ′ = u ′ ( x ) ± v ′ ( x ) [u(x) \pm v(x)]' = u'(x) \pm v'(x) [u(x)±v(x)]=u(x)±v(x)
  2. 积的导数: [ u ( x ) v ( x ) ] ′ = u ′ ( x ) v ( x ) + u ( x ) v ′ ( x ) [u(x)v(x)]' = u'(x)v(x) + u(x)v'(x) [u(x)v(x)]=u(x)v(x)+u(x)v(x)
  3. 商的导数: [ u ( x ) v ( x ) ] ′ = u ′ ( x ) v ( x ) − u ( x ) v ′ ( x ) [ v ( x ) ] 2 [\frac{u(x)}{v(x)}]' = \frac{u'(x)v(x) - u(x)v'(x)}{[v(x)]^2} [v(x)u(x)]=[v(x)]2u(x)v(x)u(x)v(x) v ( x ) ≠ 0 v(x)\neq 0 v(x)=0

分段函数

分段函数求导的时候,需要注意的是:

  1. 连续部分正常求导
  2. 但是在间断点的时候,需要考虑间断点的导数是否存在,则需要根据导数的定义,求出左右极限是否相等;若相等,则导数存在,否则该点导数不存在。

复合函数

复合函数求导指的是,函数内的变量为另一个函数,形如:

{ f [ g ( x ) ] } ′ = f ′ [ g ( x ) ] g ′ ( x ) \{f[g(x)]\}' = f'[g(x)]g'(x) {f[g(x)]}=f[g(x)]g(x)

复合函数求导其实本质上并不困难,只需要记住原本的求导公式 d y = f ′ ( u ) d u dy = f'(u) du dy=f(u)du,其中的 u u u无论是自变量还是中间变量(其他函数),求导法则都成立。

反函数

y = f ( x ) y = f(x) y=f(x)可导,且 f ( x ) ≠ 0 f(x) \neq 0 f(x)=0,则存在反函数 x = ϕ ( y ) x = \phi(y) x=ϕ(y),且 d x d y = 1 d y d x = 1 f ′ ( x ) \frac{dx}{dy} = \frac{1}{\frac{dy}{dx}} = \frac{1}{f'(x)} dydx=dxdy1=f(x)1

即, ϕ ′ ( y ) = 1 f ′ ( x ) \phi'(y) = \frac{1}{f'(x)} ϕ(y)=f(x)1

对于反函数 y = arcsin ⁡ x y = \arcsin{x} y=arcsinx,有 x = sin ⁡ y x = \sin{y} x=siny,那么

( arcsin ⁡ y ) ′ = 1 ( sin ⁡ y ) ′ = 1 cos ⁡ y = 1 1 − sin ⁡ 2 y = 1 1 − x 2 (\arcsin{y})' = \frac{1}{(\sin{y})'} = \frac{1}{\cos{y}} = \frac{1}{\sqrt{1-\sin^2{y}}} = \frac{1}{\sqrt{1-x^2}} (arcsiny)=(siny)1=cosy1=1sin2y 1=1x2 1

参数方程

至于参数方程的公式也比较好理解,针对参数方程 { x = ϕ ( t ) y = ψ ( t ) \begin{cases} x = \phi(t) \\ y = \psi(t) \end{cases} {x=ϕ(t)y=ψ(t)
d y d x = d y d t d y d t = ψ ′ ( t ) ϕ ( t ) \frac{dy}{dx} = \frac{\frac{dy}{dt}}{\frac{dy}{dt}} = \frac{\psi'(t)}{\phi(t)} dxdy=dtdydtdy=ϕ(t)ψ(t)

求导法

隐函数求导

隐函数仅需要进行等号两边求导就行,不赘述。

对数求导

对于一些很多相乘、相除的式子,可以利用对数的性质,将困难的乘除法转化为简单的加减法,再进行求导即可。

幂指数求导

对于幂指数 u ( x ) v ( x ) u(x)^{v(x)} u(x)v(x),可以将其转化为指数函数:
u ( x ) v ( x ) = e v ( x ) ln ⁡ u ( x ) u(x)^{v(x)} = e^{v(x)\ln{u(x)}} u(x)v(x)=ev(x)lnu(x)

然后再进行求导就较为简单了。

变限积分求导

F ( x ) = ∫ ϕ 1 ( x ) ϕ 2 ( x ) f ( t ) d t F(x) = \int^{\phi_2{(x)}}_{\phi_1{(x)}}{f(t)dt} F(x)=ϕ1(x)ϕ2(x)f(t)dt,对其求导为:
F ′ ( x ) = d d x [ ∫ ϕ 1 ( x ) ϕ 2 ( x ) f ( t ) d t ] = f [ ϕ 2 ( x ) ] ϕ 2 ′ ( x ) − f [ ϕ 1 ( x ) ] ϕ 1 ′ ( x ) F'(x) = \frac{d}{dx}[\int^{\phi_2{(x)}}_{\phi_1{(x)}}{f(t)dt}] = f[\phi_2{(x)}]\phi_2'{(x)} - f[\phi_1{(x)}]\phi_1'{(x)} F(x)=dxd[ϕ1(x)ϕ2(x)f(t)dt]=f[ϕ2(x)]ϕ2(x)f[ϕ1(x)]ϕ1(x)

也就是将积分上限代入x并乘以积分上限的导数,减去积分下线代入x乘以积分下限的导数。

高阶导数

高阶函数主要有三种方法:

  1. 归纳法:根据前几项总结出规律(比较常用)

  2. 莱布尼兹公式:(一般处理两个函数乘积的高阶导)

    u = u ( x ) u = u(x) u=u(x) v = v ( x ) v = v(x) v=v(x)均n阶可导,则
    [ u ± v ] ( n ) = u ( n ) ± v ( n ) , ( u v ) ( n ) = ∑ k = 0 n C n k u ( n − k ) v ( k ) [u \pm v]^{(n)} = u^{(n)} \pm v^{(n)}, \\ (uv)^{(n)} = \sum^n_{k = 0} {C^k_n u^{(n-k)} v^{(k)}} [u±v](n)=u(n)±v(n),(uv)(n)=k=0nCnku(nk)v(k)

  3. 泰勒公式:

    任何一个无穷阶可导的函数 y = f ( x ) y = f(x) y=f(x)在收敛的条件下,都可以写成:
    y = f ( x ) ∑ n = 0 ∞ f ( n ) ( x 0 ) n ! ( x − x 0 ) n y = f(x) \sum^{\infty}_{n = 0} {\frac{f^{(n)}(x_0)}{n!}(x-x_0)^n} y=f(x)n=0n!f(n)(x0)(xx0)n

泰勒公式

对于泰勒公式是如何得到的,这里做一个简单的推导。

  1. 对于每一个复杂的函数,我们都可以将其利用多个多项式的和近似表示出来:
    f ( x ) ≈ P n ( x ) = a 0 + a 1 ( x − x 0 ) + a 2 ( x − x 0 ) 2 + ⋯ + a n ( x − x 0 ) n f(x) \approx P_n(x) = a_0 + a_1(x - x_0) + a_2(x - x_0)^2 + \dots + a_n(x - x_0)^n f(x)Pn(x)=a0+a1(xx0)+a2(xx0)2++an(xx0)n

  2. x = x 0 x = x_0 x=x0,那么我们可以得到:
    { a 0 = p n ( x 0 ) ≈ f ( x 0 ) a 1 = p n ′ ( x 0 ) ≈ f ′ ( x 0 ) a 2 = p n ′ ′ ( x 0 ) ≈ f ′ ′ ( x 0 ) ⋯ a n = p n ( n ) ( x 0 ) ≈ f ( n ) ( x 0 ) \begin{cases} a_0 = p_n(x_0) \approx f(x_0) \\ a_1 = p_n'(x_0) \approx f'(x_0) \\ a_2 = p_n''(x_0) \approx f''(x_0) \\ \dotsm \\ a_n = p_n^{(n)}(x_0) \approx f^{(n)}(x_0) \end{cases} a0=pn(x0)f(x0)a1=pn(x0)f(x0)a2=pn(x0)f(x0)an=pn(n)(x0)f(n)(x0)
    各个系数 a k a_k ak都是根据f(x)求相应次导数,使得a的前 k − 1 k-1 k1项系数为0。

  3. 将所有的a代入公式得到:
    f ( x ) ≈ f ( x 0 ) + f ′ ( x 0 ) 1 ! ( x − x 0 ) + f ( 2 ) 2 ! ( x − x 0 ) 2 + ⋯ + f ( n ) ( x 0 ) n ! f(x) \approx f(x_0) + \frac{f'(x_0)}{1!} (x-x_0) + \frac{f^{(2)}}{2!}(x-x_0)^2 + \dots + \frac{f^{(n)}(x_0)}{n!} f(x)f(x0)+1!f(x0)(xx0)+2!f(2)(xx0)2++n!f(n)(x0)

  4. 以上基本就是泰勒公式的一个形式了,但是可以发现f(x)依旧是近似等于,而不是完全等于多项式,需要增加一个误差来使得等于号成立,也就是常说的余项 R n ( x ) R_n(x) Rn(x)

    • 佩亚诺余项:直接使用一个高阶无穷小—— o ( ( x − x 0 ) n ) o((x-x_0)^n) o((xx0)n)
    • 拉格朗日余项:设 g ( x ) = ( x − x 0 ) n + 1 g(x) = (x - x_0)^{n+1} g(x)=(xx0)n+1,利用柯西中值定理进行求解—— f ( n + 1 ) ( ξ ) n + 1 ( x − x 0 ) n + 1 \frac{f^{(n+1)}(\xi)}{n+1}(x-x_0)^{n+1} n+1f(n+1)(ξ)(xx0)n+1
  5. 从而泰勒公式表示为: f ( x ) = P n ( x ) + R n ( x ) f(x) = P_n(x) + R_n(x) f(x)=Pn(x)+Rn(x)


以上内容是DataWhale第28期组队学习,根据b站视频考研数学之高等数学(一二三都适用)学习整理所得,若有不足,望指出。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值