范数
在泛函分析中,它定义在赋范线性空间中,并满足一定的条件,即①非负性;②齐次性;③三角不等式。它常常被用来度量某个向量空间(或矩阵)中的每个向量的长度或大小。
- LP范数不是一个范数,而是一组范数。定义如下:
L p = ∥ x ∥ p = ∑ i = 1 n x i p p , x = ( x 1 , x 2 , … , x n ) L_p=\Vert x \Vert_p=\sqrt[p]{\sum_{i=1}^{n}{x_i^p}},x=(x_1,x_2,\dots,x_n) Lp=∥x∥p=pi=1∑nxip,x=(x1,x2,…,xn)
- L0范数表示向量中非零元素的个数。
- L1范数表示向量x中非零元素的绝对值之和。定义如下:
L 1 = ∥ x ∥ 1 = ∑ i = 1 n ∣ x i ∣ , x = ( x 1 , x 2 , … , x n ) L_1=\Vert x \Vert_1=\sum_{i=1}^{n}{|x_i|},x=(x_1,x_2,\dots,x_n) L1=∥x∥1=i=1∑n∣xi∣,x=(x1,x2,…,xn)
-
L2范数表示向量元素的平方和再开平方,即欧氏距离。
二范数指矩阵A的2范数,就是A的转置共轭矩阵与矩阵A的积的最大特征根的平方根值,是指空间上两个向量矩阵的直线距离。类似于求棋盘上两点间的直线距离。
定义如下:
L 2 = ∥ x ∥ 2 = ∑ i = 1 n x i 2 , x = ( x 1 , x 2 , … , x n ) L_2=\Vert x \Vert_2=\sqrt{\sum_{i=1}^{n}{x_i^2}},x=(x_1,x_2,\dots,x_n) L2=∥x∥2=i=1∑nxi2,x=(x1,x2,…,xn)
梯度
即对于一般标量函数
f
(
x
)
f(x)
f(x) , 其中向量为
x
=
(
x
1
,
x
2
,
…
,
x
n
)
x=(x_1,x_2,\dots,x_n)
x=(x1,x2,…,xn),导数为:
∂
f
∂
x
=
(
∂
f
∂
x
1
,
…
,
∂
f
∂
x
2
)
\frac{\partial{f}}{\partial{x}}=(\frac{\partial{f}}{\partial{x_1}},\dots,\frac{\partial{f}}{\partial{x_2}})
∂x∂f=(∂x1∂f,…,∂x2∂f)
雅可比矩阵
在向量微积分中,雅可比矩阵(Jacobi Matrix)是一阶偏导数以一定方式排列成的矩阵,其行列式称为雅可比行列式。雅可比矩阵的重要性在于它体现了一个可微方程与给出点的最优线性逼近。因此,雅可比矩阵类似于多元函数的导数。
J ( f ) = ∣ ∂ ( f 1 , … , f n ) ∂ ( x 1 , … , x n ) ∣ = ∣ ∂ f 1 ∂ x 1 … ∂ f 1 ∂ x n ⋮ ⋱ ⋮ ∂ f n ∂ x 1 … ∂ f n ∂ x n ∣ J(f)=\left|\frac{\partial{(f_1,\dots,f_n)}}{\partial{(x_1,\dots,x_n)}}\right|= \left|\begin{matrix} \frac{\partial{f_1}}{\partial{x_1}}&\dots&\frac{\partial{f_1}}{\partial{x_n}}\\ \vdots&\ddots&\vdots\\ \frac{\partial{f_n}}{\partial{x_1}}&\dots&\frac{\partial{f_n}}{\partial{x_n}}\\ \end{matrix}\right| J(f)=∣∣∣∣∂(x1,…,xn)∂(f1,…,fn)∣∣∣∣=∣∣∣∣∣∣∣∂x1∂f1⋮∂x1∂fn…⋱…∂xn∂f1⋮∂xn∂fn∣∣∣∣∣∣∣
若m=n,则雅可比矩阵为方阵,方阵的行列式为雅可比行列式。
海森矩阵
黑塞矩阵(Hessian Matrix),又译作海森矩阵、海瑟矩阵、海塞矩阵等,是一个多元函数的二阶偏导数构成的方阵,描述了函数的局部曲率。黑塞矩阵最早于19世纪由德国数学家Ludwig Otto Hesse提出,并以其名字命名。黑塞矩阵常用于牛顿法解决优化问题,利用黑塞矩阵可判定多元函数的极值问题。在工程实际问题的优化设计中,所列的目标函数往往很复杂,为了使问题简化,常常将目标函数在某点邻域展开成泰勒多项式来逼近原函数,此时函数在某点泰勒展开式的矩阵形式中会涉及到黑塞矩阵。
$$
H(f)=\left[\begin{matrix}
\frac{\partial^{2} {f}}{\partial{x_1{2}}}&\frac{\partial2{f}}{\partial{x_1}\partial{x_2}}&\dots&\frac{\partial^2{f}}{\partial{x_1}\partial{x_n}}\
\frac{\partial2{f}}{\partial{x_2}\partial{x_1}}&\frac{\partial2{f}}{\partial{x_22}}&\dots&\frac{\partial2{f}}{\partial{x_2}\partial{x_n}}\
\vdots&\vdots&\ddots&\vdots\
\frac{\partial2{f}}{\partial{x_n}\partial{x_1}}&\frac{\partial2{f}}{\partial{x_n}\partial{x_2}}&\dots&\frac{\partial2{f}}{\partial{x_n2}}\
\end{matrix}\right]
$$
泰勒公式
数学中,泰勒公式是一个用函数在某点的信息描述其附近取值的公式。如果函数足够平滑的话,在已知函数在某一点的各阶导数值的情况之下,泰勒公式可以用这些导数值做系数构建一个多项式来近似函数在这一点的邻域中的值。泰勒公式还给出了这个多项式和实际的函数值之间的偏差。
f ( x ) = f ( a ) 0 ! + f ′ ( a ) 1 ! ( x − a ) + f ′ ′ ( a ) 2 ! ( x − a ) 2 + ⋯ + f n ( a ) n ! ( x − a ) n + R n ( x ) f(x)=\frac{f(a)}{0!}+\frac{f'(a)}{1!}(x-a)+\frac{f''(a)}{2!}(x-a)^2+\dots+\frac{f^n(a)}{n!}(x-a)^n+R_n(x) f(x)=0!f(a)+1!f′(a)(x−a)+2!f′′(a)(x−a)2+⋯+n!fn(a)(x−a)n+Rn(x)
李代数
首先特殊正交群SO(3)可以代表旋转矩阵,SE(3)可以代表欧式变换矩阵。矩阵对于乘法封闭,对于加法不封闭,所以具有群的特性。
李群是指具有连续(光滑)性质的群。
-
外积
a × b = [ i j k a 1 a 2 a 3 b 1 b 2 b 3 ] = [ a 2 b 3 − a 3 b 2 a 3 b 1 − a 1 b 3 a 1 b 2 − a 2 b 1 ] = [ 0 − a 3 a 2 a 3 0 − a 1 − a 2 a 1 0 ] b ≜ a ∧ b \boldsymbol{a}\times\boldsymbol{b}= \left[ \begin{matrix} \boldsymbol{i}&\boldsymbol{j}&\boldsymbol{k}\\ a_1&a_2&a_3\\ b_1&b_2&b_3\\ \end{matrix} \right]= \left[ \begin{matrix} a_2b_3-a_3b_2\\ a_3b_1-a_1b_3\\ a_1b_2-a_2b_1\\ \end{matrix} \right]= \left[ \begin{matrix} 0&-a_3&a_2\\ a_3&0&-a_1\\ -a_2&a_1&0\\ \end{matrix} \right]\boldsymbol{b}\triangleq\boldsymbol{a}^{\wedge}\boldsymbol{b} a×b=⎣⎡ia1b1ja2b2ka3b3⎦⎤=⎣⎡a2b3−a3b2a3b1−a1b3a1b2−a2b1⎦⎤=⎣⎡0a3−a2−a30a1a2−a10⎦⎤b≜a∧b
相应的,有
a = [ a 1 i , a 2 j , a 3 k ] , a ∧ = A = [ 0 − a 3 a 2 a 3 0 − a 1 − a 2 a 1 0 ] , A ∨ = a \boldsymbol{a}=[a_1\boldsymbol{i},a_2\boldsymbol{j},a_3\boldsymbol{k}],\\ \boldsymbol{a}^{\wedge}=\boldsymbol{A}=\left[ \begin{matrix} 0&-a_3&a_2\\ a_3&0&-a_1\\ -a_2&a_1&0\\ \end{matrix} \right],\\\boldsymbol{A}^{\vee}=\boldsymbol{a} a=[a1i,a2j,a3k],a∧=A=⎣⎡0a3−a2−a30a1a2−a10⎦⎤,A∨=a -
特殊正交群 S O ( 3 ) SO(3) SO(3)
S O ( 3 ) = { R ∈ R 3 × 3 ∣ R R T = I , det ( R ) = 1 } SO(3)=\{R\in\mathbb{R}^{3\times3}|RR^T=I,\det(R)=1\} SO(3)={R∈R3×3∣RRT=I,det(R)=1} -
特殊欧式群 S E ( 3 ) SE(3) SE(3)
S E ( 3 ) = { T = [ R t 0 T 1 ] ∈ R 4 × 4 ∣ R ∈ S O ( 3 ) , t ∈ R 3 } SE(3)=\{T=\left[ \begin{matrix} R&t\\ 0^T&1\\ \end{matrix} \right]\in\mathbb{R}^{4\times4}|R\in SO(3),t\in \mathbb{R}^3\} SE(3)={T=[R0Tt1]∈R4×4∣R∈SO(3),t∈R3} -
李代数 s o ( 3 ) \mathfrak{so}(3) so(3)
在对 R R T = I RR^T=I RRT=I进行求导及整理之后,可以得到 R ( t ) ′ R ( t ) T R(t)^{'}R(t)^T R(t)′R(t)T是一个反对称矩阵,那么就用一个 ϕ ( t ) ∈ R 3 \phi(t)\in\mathbb{R}^3 ϕ(t)∈R3与之对应。有:
R ( t ) ′ R ( t ) T = ϕ ( t ) ∧ R(t)^{'}R(t)^T=\phi(t)^{\wedge} R(t)′R(t)T=ϕ(t)∧
之后求解微分方程,可以得到:
R ( t ) = e x p ( ϕ ∧ t ) R(t)=exp(\phi^{\wedge}t) R(t)=exp(ϕ∧t)
实际求解时利用到指数映射和对数映射。
奇异值分解
方阵的迹
在线性代数中,一个n×n矩阵A的主对角线(从左上方至右下方的对角线)上各个元素的总和被称为矩阵A的迹(或迹数),一般记作tr(A)。
性质
-
tr(AB)=tr(BA)
-
tr(ABC)=tr(CAB)=tr(BCA)
-
f(a)=tr(AB), ▽ A t r ( A B ) = B T \bigtriangledown_Atr(AB)=B^T ▽Atr(AB)=BT
-
t r ( A ) = t r ( A T ) tr(A)=tr(A^T) tr(A)=tr(AT)
-
tr(a)=a, a ∈ R a \in R a∈R
-
▽ A t r ( A B A T C ) = C A B + C T A B T \bigtriangledown_Atr(ABA^TC)=CAB+C^TAB^T ▽Atr(ABATC)=CAB+CTABT