一、微分
1.1 定义
正方形金属薄片,函数
A
=
x
2
A=x^2
A=x2相应的增量
Δ
A
\Delta A
ΔA,即
Δ
A
=
(
x
0
+
Δ
x
)
2
−
x
0
2
=
2
x
0
Δ
x
+
(
Δ
x
)
2
\Delta A=(x_0+\Delta x)^2-x_0^2=2x_0\Delta x+(\Delta x)^2
ΔA=(x0+Δx)2−x02=2x0Δx+(Δx)2
当
Δ
x
→
0
\Delta x\to 0
Δx→0时,第二部分
(
Δ
x
)
2
(\Delta x)^2
(Δx)2是比
Δ
x
\Delta x
Δx高阶的无穷小,即
(
Δ
x
)
2
=
o
(
Δ
x
)
(\Delta x)^2=o(\Delta x)
(Δx)2=o(Δx)。由此可见,如果边长改变很微小,即
∣
Δ
x
∣
|\Delta x|
∣Δx∣很小时,面积的改变量
Δ
A
\Delta A
ΔA可近似第用第一部分来代替。
一般地,如果函数
y
=
f
(
x
)
y=f(x)
y=f(x)满足一定条件,那么增量
Δ
y
\Delta y
Δy可表示为
Δ
y
=
A
Δ
x
+
o
(
Δ
x
)
\Delta y=A\Delta x+o(\Delta x)
Δy=AΔx+o(Δx)
其中A是不依赖于
Δ
x
\Delta x
Δx的常数,因此
A
Δ
x
A\Delta x
AΔx是
Δ
x
\Delta x
Δx的线性函数,且
Δ
y
\Delta y
Δy与它的差
Δ
y
−
A
Δ
x
=
o
(
Δ
x
)
\Delta y-A\Delta x=o(\Delta x)
Δy−AΔx=o(Δx)
是比
Δ
x
\Delta x
Δx高阶的无穷小。所以,当
A
≠
0
A\neq 0
A=0,且
∣
Δ
x
∣
|\Delta x|
∣Δx∣很小时,可以用
Δ
x
\Delta x
Δx的线性函数
A
Δ
x
A\Delta x
AΔx来近似替代
Δ
y
\Delta y
Δy。
定义:设函数
y
=
f
(
x
)
y=f(x)
y=f(x)在某区间内有定义,
x
0
x_0
x0及
x
0
+
Δ
x
x_0+\Delta x
x0+Δx在这区间内,如果函数的增量
Δ
y
=
f
(
x
0
+
Δ
x
)
−
f
(
x
0
)
\Delta y=f(x_0+\Delta x)-f(x_0)
Δy=f(x0+Δx)−f(x0)
可表示为
Δ
y
=
A
Δ
x
+
o
(
Δ
x
)
\Delta y =A\Delta x+o(\Delta x)
Δy=AΔx+o(Δx)
其中A是不依赖于
Δ
x
\Delta x
Δx的常数,那么称函数
y
=
f
(
x
)
y=f(x)
y=f(x)在点
x
0
x_0
x0是可微的,而
A
Δ
x
A\Delta x
AΔx叫做函数
y
=
f
(
x
)
y=f(x)
y=f(x)在点
x
0
x_0
x0相应于自变量增量
Δ
x
\Delta x
Δx的微分,记作
d
y
dy
dy,即
d
y
=
A
Δ
x
dy=A\Delta x
dy=AΔx
例1:求函数
y
=
x
2
y=x^2
y=x2在
x
=
1
x=1
x=1处的微分
解:函数
y
=
x
2
y=x^2
y=x2在
x
=
1
x=1
x=1处的微分为
d
y
=
(
x
2
)
′
∣
x
=
1
Δ
x
=
2
Δ
x
dy=(x^2)'|_{x=1}\Delta x=2\Delta x
dy=(x2)′∣x=1Δx=2Δx
函数
y
=
f
(
x
)
y=f(x)
y=f(x)在任意点x的微分,称为函数的微分,记作
d
y
dy
dy或
d
f
(
x
)
df(x)
df(x),即
d
y
=
f
′
(
x
)
Δ
x
dy=f'(x)\Delta x
dy=f′(x)Δx
例2:函数
y
=
c
o
s
x
y=cos \space x
y=cos x的微分为
d
y
=
(
c
o
s
x
)
′
Δ
x
=
−
s
i
n
x
Δ
x
dy=(cos \space x)'\Delta x=-sin\space x\Delta x
dy=(cos x)′Δx=−sin xΔx
例3:求函数
y
=
x
3
y=x^3
y=x3当
x
=
2
x=2
x=2,
Δ
x
=
0.02
\Delta x=0.02
Δx=0.02时的微分
解:先求函数在任意点x的微分
d
y
=
(
x
3
)
’
Δ
x
=
3
x
2
Δ
x
dy=(x^3)’\Delta x=3x^2\Delta x
dy=(x3)’Δx=3x2Δx
再求函数当
x
=
2
,
Δ
x
=
0.02
x=2,\Delta x=0.02
x=2,Δx=0.02时的微分
d
y
∣
x
=
2
,
Δ
x
=
0.02
=
(
3
x
2
Δ
x
)
∣
x
=
2
,
Δ
x
=
0.02
=
3
⋅
2
2
⋅
0.02
=
0.24
dy|_{x=2,\Delta x=0.02}=(3x^2\Delta x)|_{x=2,\Delta x=0.02}=3·2^2·0.02=0.24
dy∣x=2,Δx=0.02=(3x2Δx)∣x=2,Δx=0.02=3⋅22⋅0.02=0.24
通常把自变量x的增量
Δ
x
\Delta x
Δx称为自变量的微分,记作
d
x
dx
dx,即
d
x
=
Δ
x
dx=\Delta x
dx=Δx,于是函数
y
=
f
(
x
)
y=f(x)
y=f(x)的微分又可记作
d
y
=
f
′
(
x
)
d
x
dy=f'(x)dx
dy=f′(x)dx
从而有
d
y
d
x
=
f
′
(
x
)
\frac{dy}{dx}=f'(x)
dxdy=f′(x)
这就是说,函数的微分
d
y
dy
dy与自变量的微分
d
x
dx
dx之商等于该函数的导数。因此,导数也叫做“微商”。
1.2 几何意义
在直角坐标系中,函数 y = f ( x ) y=f(x) y=f(x)的图形是一条曲线。对于某一固定的 x 0 x_0 x0值,曲线上有一个确定点 M ( x 0 , y 0 ) M(x_0,y_0) M(x0,y0),当自变量x有微小增量 Δ x \Delta x Δx时,就得到曲线上另一点 N ( x 0 + Δ x , y 0 + Δ y ) N(x_0+\Delta x,y_0+\Delta y) N(x0+Δx,y0+Δy)。
由图可知
M
Q
=
Δ
x
,
Q
N
=
Δ
y
MQ=\Delta x,\\ QN=\Delta y
MQ=Δx,QN=Δy
过点M作曲线的切线MT,它的倾角为
α
\alpha
α,则
Q
P
=
M
Q
⋅
t
a
n
α
=
Δ
x
⋅
f
′
(
x
0
)
QP=MQ·tan\space \alpha=\Delta x·f'(x_0)
QP=MQ⋅tan α=Δx⋅f′(x0)
即
d
y
=
Q
P
dy=QP
dy=QP
由此可见,对于可微函数
y
=
f
(
x
)
y=f(x)
y=f(x)而言,当
Δ
y
\Delta y
Δy是曲线
y
=
f
(
x
)
y=f(x)
y=f(x)上的点的纵坐标增量时,
d
y
dy
dy就是曲线的切线上点的纵坐标的相应增量。当
∣
Δ
x
∣
|\Delta x|
∣Δx∣很小时,
∣
Δ
y
−
d
y
∣
|\Delta y-dy|
∣Δy−dy∣比|
Δ
x
\Delta x
Δx|小得多。因此在点M邻近,我们可以用切线线段来近似代替曲线段。在局部范围内用线性函数近似非线性函数,在几何上就是局部用切线段近似替代曲线段,这在数学上称为非线性函数的局部线性化。
二、全微分
由偏导数定义知,二元函数对某个自变量的偏导数表示当另一个自变量固定时,因变量相对于该自变量的变化率。根据一元函数微分学中增量与微分的关系,可得
f
(
x
+
Δ
x
,
y
)
−
f
(
x
,
y
)
≈
f
x
(
x
,
y
)
Δ
x
,
f
(
x
,
y
+
Δ
y
)
−
f
(
x
,
y
)
≈
f
y
(
x
,
y
)
Δ
y
f(x+\Delta x,y)-f(x,y) \approx f_x(x,y)\Delta x, \\ f(x,y+\Delta y)-f(x,y) \approx f_y(x,y)\Delta y
f(x+Δx,y)−f(x,y)≈fx(x,y)Δx,f(x,y+Δy)−f(x,y)≈fy(x,y)Δy
上面两式的左端分别叫做二元函数对x和对y的偏增量,而右端分别叫做二元函数对x和y的偏微分。
在实际问题中,有时需要研究多元函数中各个自变量都取得增量时因变量所获得的增量,即所谓的全增量问题。下面以二元函数为例进行讨论。
设函数
z
=
f
(
x
,
y
)
z=f(x,y)
z=f(x,y)在点
P
(
x
,
y
)
P(x,y)
P(x,y)的某邻域内有定义,
P
′
(
x
+
Δ
x
,
y
+
Δ
y
)
P'(x+\Delta x,y+\Delta y)
P′(x+Δx,y+Δy)为这邻域内的任意一点,则称这两点的函数值之差
f
(
x
+
Δ
x
,
y
+
Δ
y
)
−
f
(
x
,
y
)
f(x+\Delta x,y+\Delta y)-f(x,y)
f(x+Δx,y+Δy)−f(x,y)为函数在点P对应于自变量增量
Δ
x
\Delta x
Δx和
Δ
y
\Delta y
Δy的全增量,记作
Δ
z
\Delta z
Δz,即
Δ
z
=
f
(
x
+
Δ
x
,
y
+
Δ
y
)
−
f
(
x
,
y
)
\Delta z=f(x+\Delta x,y+\Delta y)-f(x,y)
Δz=f(x+Δx,y+Δy)−f(x,y)
一般说来,计算全增量
Δ
z
\Delta z
Δz比较复杂。与一元函数的情形一样,我们希望用自变量的增量
Δ
x
、
Δ
y
\Delta x、\Delta y
Δx、Δy的线性函数来近似地代替函数的全增量
Δ
z
\Delta z
Δz,从而引入如下定义。
定义:设函数
z
=
f
(
x
,
y
)
z=f(x,y)
z=f(x,y)在点
(
x
,
y
)
(x,y)
(x,y)的某邻域内有定义,如果函数在点
(
x
,
y
)
(x,y)
(x,y)的全增量
Δ
z
=
f
(
x
+
Δ
x
,
y
+
Δ
y
)
−
f
(
x
,
y
)
\Delta z=f(x+\Delta x,y+\Delta y)-f(x,y)
Δz=f(x+Δx,y+Δy)−f(x,y)
可表示为
Δ
z
=
A
Δ
x
+
B
Δ
y
+
o
(
ρ
)
\Delta z =A\Delta x+B\Delta y+o(\rho)
Δz=AΔx+BΔy+o(ρ)
其中A和B不依赖于
Δ
x
\Delta x
Δx和
Δ
y
\Delta y
Δy而仅与x和y有关,
ρ
=
(
Δ
x
)
2
+
(
Δ
y
)
2
\rho=\sqrt{(\Delta x)^2+(\Delta y)^2}
ρ=(Δx)2+(Δy)2,那么称函数
z
=
f
(
x
,
y
)
z=f(x,y)
z=f(x,y)在点
(
x
,
y
)
(x,y)
(x,y)可微分,而
A
Δ
x
+
B
Δ
y
A\Delta x+B\Delta y
AΔx+BΔy称为函数
z
=
f
(
x
,
y
)
z=f(x,y)
z=f(x,y)在点
(
x
,
y
)
(x,y)
(x,y)的全微分,记作
d
z
dz
dz,即
d
z
=
A
Δ
x
+
B
Δ
y
dz=A\Delta x+B\Delta y
dz=AΔx+BΔy
如果函数在区域D内各点处都可微分,那么称这函数在D内可微分。
定理1(必要条件):如果函数
z
=
f
(
x
,
y
)
z=f(x,y)
z=f(x,y)在点
(
x
,
y
)
(x,y)
(x,y)可微分,那么该函数在点
(
x
,
y
)
(x,y)
(x,y)的偏导数
∂
z
∂
x
\frac{\partial z}{\partial x}
∂x∂z与
∂
z
∂
y
\frac{\partial z}{\partial y}
∂y∂z必定存在,且函数
z
=
f
(
x
,
y
)
z=f(x,y)
z=f(x,y)在点
(
x
,
y
)
(x,y)
(x,y)的全微分为
d
z
=
∂
z
∂
x
Δ
x
+
∂
z
∂
y
Δ
y
dz=\frac{\partial z}{\partial x}\Delta x+\frac{\partial z}{\partial y}\Delta y
dz=∂x∂zΔx+∂y∂zΔy
定理2(充分条件):如果函数
z
=
f
(
x
,
y
)
z=f(x,y)
z=f(x,y)的偏导数
∂
z
∂
x
\frac{\partial z}{\partial x}
∂x∂z、
∂
z
∂
y
\frac{\partial z}{\partial y}
∂y∂z在点
(
x
,
y
)
(x,y)
(x,y)连续,那么函数在该点可微分。
以上关于二元函数全微分的定义及可微分的必要条件和充分条件,可以完全类似地推广到三元和三元以上的多元函数。
习惯上,我们将自变量的增量
Δ
x
\Delta x
Δx与
Δ
y
\Delta y
Δy分别记作
d
x
dx
dx与
d
y
dy
dy,并分别称为自变量x与y的微分。这样,函数
z
=
f
(
x
,
y
)
z=f(x,y)
z=f(x,y)的全微分就可写为
d
z
=
∂
z
∂
x
d
x
+
∂
z
∂
y
d
y
dz=\frac{\partial z}{\partial x}dx+\frac{\partial z}{\partial y}dy
dz=∂x∂zdx+∂y∂zdy
通常把二元函数的全微分等于它的两个偏微分之和这件事称为二元函数的微分符合叠加原理。
叠加原理也适用于二元以上的函数。例如,如果三元函数
u
=
f
(
x
,
y
,
z
)
u=f(x,y,z)
u=f(x,y,z)可微分,那么它的全微分就等于它的三个偏微分之和,即
d
u
=
∂
u
∂
x
d
x
+
∂
u
∂
y
d
y
+
∂
u
∂
z
d
z
du=\frac{\partial u}{\partial x}dx+\frac{\partial u}{\partial y}dy+\frac{\partial u}{\partial z}dz
du=∂x∂udx+∂y∂udy+∂z∂udz