这个专栏主要是想和大家分享一下深度学习的基础知识,主要是以吴恩达老师深度学习课程内容作为基础,并补充了很多其他内容希望让整体内容更加容易理解和系统化。如果想要了解具体专栏里面有什么内容的话,可以看一看我们专栏的目录,在目录里面还说明了小伙伴的分工,这些内容都是所有小伙伴们一起努力完成的,有希望和我们一起学习的的小伙伴也可以加入我们啊。另外我们还将内容以书籍的形式放到了github上,之后还会陆续上传源码实现等其他内容。我们还会分享深度学习-论文阅读专栏、强化学习-基础知识专栏、强化学习-任务阅读专栏,也欢迎大家关注。可能会有很多错漏,希望大家批评指正!还是那句话,不要高估一年的努力,也不要低估十年的积累,与君共勉!
5. 导数
5.1 导数定义
-
导数第一种定义
设函数 y = f ( x ) y = f(x) y=f(x)在点 x 0 x0 x0 的某个邻域内有定义,当自变量 x x x 在 x 0 x0 x0 处有增量 Δ x \Delta x Δx ( x 0 + Δ x x0 + \Delta x x0+Δx也在该邻域内 ) 时相应地函数取得增量 Δ y = f ( x 0 + Δ x ) − f ( x 0 ) \Delta y =f(x0 + \Delta x) - f(x0) Δy=f(x0+Δx)−f(x0) 如果 Δ y \Delta y Δy与 Δ x \Delta x Δx 之比当 Δ x → 0 \Delta x→0 Δx→0 时极限存在则称函数 y = f ( x ) y = f(x) y=f(x)在点 x 0 x0 x0处可导,并称这个极限值为函数 y = f ( x ) y = f(x) y=f(x) 在点 x 0 x0 x0 处的导数记为 f ′ ( x 0 ) f'(x0) f′(x0) ,即导数第一定义。
f ′ ( x ) = lim Δ x → 0 f ( x + Δ x ) − f ( x ) Δ x f'(x)=\lim_{\Delta x\to 0}\frac{f(x+\Delta x)-f(x) }{\Delta x} f′(x)=Δx→0limΔxf(x+Δx)−f(x) -
导数第二种定义
设函数 y = f ( x ) y = f(x) y=f(x) 在点 x 0 x0 x0 的某个邻域内有定义,当自变量 x x x 在 x 0 x0 x0 处有增量 − Δ x -\Delta x −Δx( x 0 − Δ x x0 - \Delta x x0−Δx也在该邻域内 ) 时相应地函数取得增量 Δ y = f ( x 0 ) − f ( x 0 − Δ x ) \Delta y=f(x0)-f(x0 - \Delta x) Δy=f(x0)−f(x0−Δx) 如果 Δ y \Delta y Δy与 Δ x \Delta x Δx 之比当 Δ x → 0 \Delta x→0 Δx→0 时极限存在则称函数 y = f ( x ) y = f(x) y=f(x)在点 x 0 x0 x0 处可导,并称这个极限值为函数 y = f ( x ) y = f(x) y=f(x) 在点 x 0 x0 x0 处的导数记为 f ′ ( x 0 ) f'(x0) f′(x0) ,即导数第二定义。
f ′ ( x ) = lim Δ x → 0 f ( x ) − f ( x − Δ x ) Δ x f'(x)=\lim_{\Delta x\to 0}\frac{f(x)-f(x-\Delta x)}{\Delta x} f′(x)=Δx→0limΔxf(x)−f(x−Δx) -
几何意义
函数 y = f ( x ) y=f(x) y=f(x)在 x 0 x0 x0点的导数 f ′ ( x 0 ) f'(x0) f′(x0)的几何意义表示函数曲线在P0 点的切线斜率。
5.2 导数计算公式
这里将列举六类基本初等函数的导数:
1.常函数 即常数 y = c ( c 为 常 数 ) y ′ = 0 y=c(c为常数) y'=0 y=c(c为常数)y′=0
2.幂函数 y = x n , y ′ = n ∗ x ( n − 1 ) ( n ∈ R ) y=x^n,y'=n*x^(n-1)(n∈R) y=xn,y′=n∗x(n−1)(n∈R)
3.基本导数公式 指数函数 y = a x , y ′ = a x ∗ l n a y=a^x,y'=a^x * lna y=ax,y′=ax∗lna
4对数函数 y = l o g a X , y ′ = 1 / ( x l n a ) ( a > 0 且 a ≠ 1 , x > 0 ) y=logaX,y'=1/(xlna) (a>0且a≠1,x>0) y=logaX,y′=1/(xlna)(a>0且a=1,x>0)
5.三角函数
(1)正弦函数: y = ( s i n x ) y ′ = c o s x y=(sinx) y'=cosx y=(sinx)y′=cosx
(2)余弦函数: y = c o s x y ′ = − s i n x y=cosx y'=-sinx y=cosxy′=−sinx
(3)正切函数: y = ( t a n x y ′ = 1 / ( c o s x ) 2 y=(tanx y'=1/(cosx)^2 y=(tanxy′=1/(cosx)2
(4)余切函数: y = c o t x y ′ = − 1 / ( s i n x ) 2 y=cotx y'=-1/(sinx)^2 y=cotxy′=−1/(sinx)2
6.反三角函数
(1)反正弦函数 y = a r c s i n x y ′ = 1 / 1 − x 2 y=arcsinx y'=1/\sqrt{1-x^2} y=arcsinxy′=1/1−x2
(2)反余弦函数 y = a r c c o s x y ′ = − 1 / 1 − x 2 y=arccosx y'=-1/\sqrt{1-x^2} y=arccosxy′=−1/1−x2
(3)反正切函数 y = a r c t a n x y ′ = 1 / ( 1 + x 2 ) y=arctanx y'=1/(1+x^2) y=arctanxy′=1/(1+x2)
(4)反余切函数 y = a r c c o t x y ′ = − 1 / ( 1 + x 2 ) y=arccotx y'=-1/(1+x^2) y=arccotxy′=−1/(1+x2)
5.3 偏导数
在数学中,一个多变量的函数的偏导数,就是它关于其中一个变量的导数,同时保持其他变量恒定。
5.4 偏导数几何意义
表示固定面上一点的切线斜率。
偏导数 f’x(x0,y0) 表示固定面上一点对 x 轴的切线斜率;偏导数 f ′ y ( x 0 , y 0 ) f'y(x0,y0) f′y(x0,y0)表示固定面上一点对 y 轴的切线斜率。
高阶偏导数:如果二元函数 z=f(x,y) 的偏导数 f ′ x ( x , y ) f'x(x,y) f′x(x,y)与 f ′ y ( x , y ) f'y(x,y) f′y(x,y) 仍然可导,那么这两个偏导函数的偏导数称为 z = f ( x , y ) z=f(x,y) z=f(x,y) 的二阶偏导数。二元函数的二阶偏导数有四个: f " x x , f " x y , f " y x , f " y y f"xx,f"xy,f"yx,f"yy f"xx,f"xy,f"yx,f"yy。
注意:
f " x y f"xy f"xy与 f " y x f"yx f"yx的区别在于:前者是先对 x 求偏导,然后将所得的偏导函数再对 y 求偏导;后者是先对 y 求偏导再对 x 求偏导。当 f " x y f"xy f"xy与 f " y x f"yx f"yx 都连续时,求导的结果与先后次序无关。
5.5 链式法则
复合函数对自变量的导数等于已知函数对中间变量的导数乘以中间变量对自变量的导数–称为链式法则。
链式法则(chain rule)是微积分中的求导法则,用以求一个复合函数的导数。所谓的复合函数,是指以一个函数作为另一个函数的自变量。如设 f ( x ) = 3 x , g ( x ) = x + 3 , g ( f ( x ) ) f(x)=3x,g(x)=x+3,g(f(x)) f(x)=3x,g(x)=x+3,g(f(x))就是一个复合函数,并且 g ′ ( f ( x ) ) = 3 g′(f(x))=3 g′(f(x))=3。若 h ( x ) = f ( g ( x ) ) h(x)=f(g(x)) h(x)=f(g(x)),则 h ′ ( x ) = f ′ ( g ( x ) ) g ′ ( x ) h'(x)=f'(g(x))g'(x) h′(x)=f′(g(x))g′(x)。
链式法则用文字描述,就是“由两个函数凑起来的复合函数,其导数等于里边函数代入外边函数的值之导数,乘以里边函数的导数。”