文章内容
本文章主要介绍了矩阵微积分中的 矩阵求导 相关数学知识
标准函数
d f ( x ) d x \frac { d f ( x ) } { d x } dxdf(x):其中f(x)与x均可为标量,向量,矩阵,所以有3*3=9种类型函数
布局类型
1.分子布局
分子为列向量则求导为列向量,即求导结果的维度以分子为主
2.分母布局
分母为列向量则求导为列向量,即求导结果的维度以分母为主
PS:两种布局所得结果互为转置,故无性质上不同,仅为定义上的差异,根据行业流行和个人习惯进行选择即可
注:本文采用分母布局
矩阵求导实质
d A d B \frac { d A } { d B } dBdA:矩阵A中各元素对矩阵B中各元素求导
三种函数类型
9种函数类型殊途同归,下面介绍三种最基本的函数类型
1.f(x)为标量函数,x为向量
即
f
(
x
)
=
f
(
x
1
,
x
2
,
⋯
,
x
n
)
,
x
=
[
x
1
,
x
2
,
⋯
,
x
n
]
T
即f ( x ) = f ( x _ { 1 } , x _ { 2 , } \cdots , x _ { n } ) ,x= \left[ x _ { 1 } , x _ { 2 , \cdots } , x _ { n } \right] ^ { T }
即f(x)=f(x1,x2,⋯,xn),x=[x1,x2,⋯,xn]T
故有
d
f
(
x
)
d
x
=
[
d
f
(
x
)
d
x
1
,
d
f
(
x
)
d
x
2
⋯
d
f
(
x
)
d
x
n
]
T
=
∇
f
(
梯度
)
G
r
a
d
i
e
n
t
\frac { d f ( x ) } { d x } = \left[ \frac { d f ( x ) } { d x _ { 1 } } , \frac { d f ( x ) } { d x _ { 2 } } \cdots \frac { d f ( x ) } { d x _ { n } } \right] ^ { T } = \nabla f ( 梯度)G r a d i e n t
dxdf(x)=[dx1df(x),dx2df(x)⋯dxndf(x)]T=∇f(梯度)Gradient
这里就可以对分母布局进行解释:
此处x为列向量,其作为分母,故求导结果以列向量形式输出
2.f(x)为向量函数,x为标量
即
f
(
x
)
=
[
f
1
(
x
)
,
f
2
(
x
)
,
…
,
f
n
(
x
)
]
T
即 f ( x ) = \left[ f _ { 1 } ( x ) , f _ { 2 } ( x ) , \ldots , f _ { n } ( x ) \right] ^ { T }
即f(x)=[f1(x),f2(x),…,fn(x)]T
故有
d
f
(
x
)
d
x
=
[
d
f
1
(
x
)
d
x
,
d
f
2
(
x
)
d
x
,
…
,
d
f
n
(
x
)
d
x
]
\frac { d f ( x ) } { d x } = \left[ \frac { d f _ { 1 } ( x ) } { d x } , \frac { d f _ { 2 } ( x ) } { d x } , \ldots , \frac { d f _ { n } ( x ) } { d x } \right]
dxdf(x)=[dxdf1(x),dxdf2(x),…,dxdfn(x)]
3.f(x)为向量函数,x为向量
即
f
(
x
)
=
[
f
1
(
x
)
,
f
2
(
x
)
,
…
,
f
n
(
x
)
]
T
,
x
=
[
x
1
,
x
2
,
,
⋯
,
x
n
]
T
即 f ( x ) = \left[ f _ { 1 } ( x ) , f _ { 2 } ( x ) , \ldots , f _ { n } ( x ) \right] ^ { T } , x = \left[ x _ { 1 } , x _ { 2 , } , \cdots , x _ { n } \right] ^ { T }
即f(x)=[f1(x),f2(x),…,fn(x)]T,x=[x1,x2,,⋯,xn]T
故有
此矩阵又称为雅可比矩阵(Jacobian matrix)