【论文笔记】标准正交基和投影在分布式控制中的应用

写在前面

原论文标题:Distributed convex optimization via continuous-time coordination algorithms with discrete-time communication.

之所以想要写这篇文章,是因为最近在看的一篇分布式优化论文(Kia 2015)1,其中有这么一个问题。

Π n = I n − 1 n 1 n 1 n T \Pi_n=I_n-\frac{1}{n}1_n 1_n^T Πn=Inn11n1nT。为了简便表示,可以定义 r ∈ R n r\in\mathbb R^n rRn R ∈ R n × ( n − 1 ) R\in\mathbb R^{n\times (n-1)} RRn×(n1),且满足以下条件:
r = 1 n 1 n ,   r T R = 0 ,   R T R = I n − 1 ,   R R T = Π n 。 r=\frac{1}{\sqrt{n}} 1_n,\,r^TR= 0,\,R^TR=I_{n-1},\,RR^T=\Pi_n。 r=n 11nrTR=0RTR=In1RRT=Πn
那么如何得到期望的 R R R

显然这里, [ r , R ] [r, R] [r,R] n n n维空间的一组标准正交基(orthonormal basis)。现在已知 r r r需要求出所有 R R R的列向量。这就需要线性代数中标准正交基和投影的知识。

正交基与投影

一个 n n n维空间中任何一组线性无关(linearly independent)的向量,都是这个 n n n维空间的一组基。当这组基的向量两两垂直(即 e i T e j = 0 e_i^Te_j=0 eiTej=0),则称为正交基(orthogonal basis)。而标准正交基只是将正交基又添加了一个条件,模长为1(即 ∥ e i ∥ = 1 \|e_i\|=1 ei=1)。一个空间可以有无数组基向量,正交基和标准正交基也同样是有无数组的。

一维投影相当于把一个向量投影到另一个向量,可以进一步求取正交基。以下图片来自Jakob_Hu的博客2

已知向量 u u u v v v,按照如上图所示方法可以求取投影 p = u T v ∥ u ∥ 2 u p=\frac{u^Tv}{\|u\|^2}u p=u2uTvu。求出 p p p后,进一步求出正交向量 v − p v-p vp非常容易。这就解决了在二维空间中求取一组正交基的问题,正交基为 p p p v − p v-p vp

高维投影和Gram-Schmidt过程

为了解决第一节提到的问题,我们需要一个能够通过任意维度的一组基构造空间的正交基的算法。

三维空间

以三维向量为例,假设存在一组三维向量,需要求出这三个向量所在空间的正交基,其中两个已经处理得到相互正交的向量 p 1 p_1 p1 p 2 p_2 p2。再加上向量 w w w构成三维空间的一组基。

下一步我们需要做 w w w p 1 p_1 p1 p 2 p_2 p2构成的二维子空间的投影 p p p,则 w − p w-p wp即我们想要的正交向量。

  1. 分别做 w w w p 1 p_1 p1 p 2 p_2 p2上的投影,得到 w T p 1 ∥ p 1 ∥ 2 p 1 \frac{w^Tp_1}{\|p_1\|^2}p_1 p12wTp1p1 w T p 2 ∥ p 2 ∥ 2 p 2 \frac{w^Tp_2}{\|p_2\|^2}p_2 p22wTp2p2,则 p = w T p 1 ∥ p 1 ∥ 2 p 1 + w T p 2 ∥ p 2 ∥ 2 p 2 p=\frac{w^Tp_1}{\|p_1\|^2}p_1+\frac{w^Tp_2}{\|p_2\|^2}p_2 p=p12wTp1p1+p22wTp2p2
  2. 计算 w − p w-p wp,得到 w − w T p 1 ∥ p 1 ∥ 2 p 1 − w T p 2 ∥ p 2 ∥ 2 p 2 w-\frac{w^Tp_1}{\|p_1\|^2}p_1-\frac{w^Tp_2}{\|p_2\|^2}p_2 wp12wTp1p1p22wTp2p2即第三维的正交向量。

三维空间求正交基的整个过程可以看做是先求出相应的二维空间的正交基,进一步求取三维空间正交基。

四维及以上空间

与三维空间相似,先求取低维度空间的正交基,在其基础上进行高一维度正交基的求取。

给出任何一组 n n n维空间的基,正交基的过程都可以通过逐一维度的计算得到。任何一个维度的向量都减去它在低维度空间中已经正交的向量的投影,这一过程就是Gram-Schmidt过程

Gram-Schmidt过程构造标准正交基

回到第一节提到的问题,现在我们已知 n n n维空间的任意一个向量 r r r,如何利用Gram-Schmidt过程构造一组标准正交基。

% 维度为4
n = 4;
r = ones(n,1)/n;

% r'的零空间
N = @(A) eye(size(A,2))-pinv(A)*A;
R1 = N(r');
R1 = R1./vecnorm(R1);

% [r R1(:,1)]'的零空间
R2 = N([r R1(:,1)]');
R2 = R2./vecnorm(R2);

% [r R1(:,1) R2(:,2)]'的零空间
R3 = N([r R1(:,1) R2(:,2)]');
R3 = R3./vecnorm(R3);
R = [R1(:,1) R2(:,2) R3(:,3)];

由此构建第一节需要的 R R R

后记

这里最后提一下,按照前面这样定义的 R R R会有什么好的性质。

首先,自不必说,有,
r = 1 n 1 n ,   r T R = 0 ,   R T R = I n − 1 ,   R R T = Π n 。 r=\frac{1}{\sqrt{n}}\boldsymbol 1_n,\,r^TR=\boldsymbol 0,\,R^TR=I_{n-1},\,RR^T=\Pi_n。 r=n 11nrTR=0RTR=In1RRT=Πn
然后, P = [ r , R ] P=[r,R] P=[r,R]显然是标准正交基组成的矩阵。由于 P P P满秩,所以
P T P = P P T = I n ,   R T P = [ 0 n − 1 , I n − 1 ] ,   Π n P = R R T P = R [ 0 n − 1 , I n − 1 ] = [ 0 n − 1 , R ] 。 P^TP=PP^T=I_n,\,R^TP=[0_{n-1},I_{n-1}],\, \Pi_n P=RR^TP=R[0_{n-1},I_{n-1}]=[0_{n-1},R]。 PTP=PPT=InRTP=[0n1,In1]ΠnP=RRTP=R[0n1,In1]=[0n1,R]
下面给出该性质在第一节所看论文中的应用。

Section 4.1中的应用

定义图 G \mathcal G G是强连通平衡图,其拉普拉斯矩阵为 L L L。现有动力学如下
v ˙ = α β L x , x ˙ = − α ∇ f ( x ) − β L x − v , \begin{aligned} \dot v&=\alpha\beta Lx,\\ \dot x&=-\alpha\nabla f(x)-\beta Lx-v, \end{aligned} v˙x˙=αβLx=αf(x)βLxv
其中 1 n T v = 0 1_n^Tv=0 1nTv=0,故也有 r T v = 0 r^Tv=0 rTv=0。令 v ˉ = − α ∇ f ( x ˉ ) \bar v=-\alpha\nabla f(\bar x) vˉ=αf(xˉ)

定义坐标变换
u = v − v ˉ ,   y = x − x ˉ , u = P w ,   y = P z 。 \begin{aligned} u&=v-\bar v,\,&y &=x-\bar x,\\ u&=Pw,\,&y&=Pz。 \end{aligned} uu=vvˉ=Pwyy=xxˉ=Pz
由于拉普拉斯矩阵的性质, P T L P = diag ⁡ ( 0 , R T L R ) P^TLP=\operatorname{diag}( 0,R^TLR) PTLP=diag(0,RTLR)。同时, r T P w = r T ( v − v ˉ ) = r T v ˉ r^TPw=r^T(v-\bar v)=r^T\bar v rTPw=rT(vvˉ)=rTvˉ R T P w = w 2 : n R^TPw=w_{2:n} RTPw=w2:n

定义 h = ∇ f ( y + x ˉ ) − ∇ f ( x ˉ ) h=\nabla f(y+\bar x)-\nabla f(\bar x) h=f(y+xˉ)f(xˉ),有
w ˙ 1 = 0 , w ˙ 2 : n = α β R T L R z 2 : n , z ˙ 1 = − α r T h , z ˙ 2 : n = − α R T h − β R T L R z 2 : n − w 2 : n 。 \begin{aligned} \dot w_1&=0,\\ \dot w_{2:n}&=\alpha\beta R^TLRz_{2:n},\\ \dot z_1&=-\alpha r^Th,\\ \dot z_{2:n}&=-\alpha R^Th-\beta R^TLRz_{2:n}-w_{2:n}。 \end{aligned} w˙1w˙2:nz˙1z˙2:n=0=αβRTLRz2:n=αrTh=αRThβRTLRz2:nw2:n

Section 5.2中的应用

z ~ 2 : n ( t ) = z 2 : n ( t k ) − z 2 : n ( t ) = R T P ( z ( t k ) − z ( t ) ) = R T ( x ( t k ) − x ( t ) ) \tilde z_{2:n}(t)=z_{2:n}(t_k)-z_{2:n}(t)=R^TP(z(t_k)-z(t))=R^T(x(t_k)-x(t)) z~2:n(t)=z2:n(tk)z2:n(t)=RTP(z(tk)z(t))=RT(x(tk)x(t)),则有
z ~ 2 : n T ( t ) z ~ 2 : n ( t ) = ( x ( t k ) − x ( t ) ) T R R T ( x ( t k ) − x ( t ) ) = ( x ( t k ) − x ( t ) ) T Π ( x ( t k ) − x ( t ) ) 。 \tilde z_{2:n}^T(t)\tilde z_{2:n}(t)=(x(t_k)-x(t))^TRR^T(x(t_k)-x(t))=(x(t_k)-x(t))^T\Pi(x(t_k)-x(t))。 z~2:nT(t)z~2:n(t)=(x(tk)x(t))TRRT(x(tk)x(t))=(x(tk)x(t))TΠ(x(tk)x(t))
由于 Π \Pi Π是幂等的,即 Π = Π 2 \Pi=\Pi^2 Π=Π2。因此, ∥ z ~ 2 : n ( t ) ∥ = ∥ Π ( x ( t k ) − x ( t ) ) ∥ \|\tilde z_{2:n}(t)\|=\|\Pi(x(t_k)-x(t))\| z~2:n(t)=Π(x(tk)x(t))

p = [ z T , w 2 : n T ] T p=[z^T,w_{2:n}^T]^T p=[zT,w2:nT]T,同样的由于 Π \Pi Π的幂等性,有
p T p = z T z + w 2 : n T w 2 : n = y T P P T y + w P T R R T P w = ( x − x ˉ ) T ( x − x ˉ ) + ( v − v ˉ ) T Π ( v − v ˉ ) p^Tp=z^Tz+w_{2:n}^Tw_{2:n}=y^TPP^Ty+wP^TRR^T Pw=(x-\bar x)^T(x-\bar x)+(v-\bar v)^T\Pi(v-\bar v) pTp=zTz+w2:nTw2:n=yTPPTy+wPTRRTPw=(xxˉ)T(xxˉ)+(vvˉ)TΠ(vvˉ)
因此, ∥ p ∥ = ∥ x − x ˉ ∥ 2 + ∥ Π ( v − v ˉ ) ∥ 2 \|p\|=\sqrt{\|x-\bar x\|^2+\|\Pi(v-\bar v)\|^2} p=xxˉ2+Π(vvˉ)2

题外话

此外,简单记录下第一节所看论文的另外一些收获。

两个定理

证明收敛性和有界性用到的两个定理3

Lemma 3.4. (Comparison lemma) Consider the scalar differential equation
u ˙ = f ( t , u ) ,   u ( t 0 ) = u 0 \dot u=f(t,u),\,u(t_0)=u_0 u˙=f(t,u),u(t0)=u0
where f ( t , u ) f(t,u) f(t,u) is continuous in t t t and locally Lipschitz in u u u, for all t ≥ 0 t\geq 0 t0 and all u ∈ J ⊂ R u\in J\subset \mathbb R uJR. Let [ t 0 , T ) [t_0,T) [t0,T) ( T T T could be infinity) be the maximal interval of existence of the solution u ( t ) u(t) u(t) and suppose u ( t ) ∈ J u(t)\in J u(t)J for all t ∈ [ t 0 , T ) t\in[t_0,T) t[t0,T). Let v ( t ) v(t) v(t) be a continuous function whose upper right-hand derivative D + v ( t ) D^+v(t) D+v(t) satisfies the differential inequality
D + v ( t ) ≤ f ( t , v ( t ) ) ,   v ( t 0 ) ≤ u 0 , D^+v(t)\leq f(t,v(t)),\,v(t_0)\leq u_0, D+v(t)f(t,v(t)),v(t0)u0,
with v ( t ) ∈ J v(t)\in J v(t)J for all t ∈ [ t 0 , T ) t\in[t_0,T) t[t0,T). Then, v ( t ) ≤ u ( t ) v(t)\leq u(t) v(t)u(t) for all t ∈ [ t 0 , T ) t\in[t_0,T) t[t0,T).

可以知道,当 v ˙ ( t ) ≤ u ˙ ( t ) \dot v(t)\leq \dot u(t) v˙(t)u˙(t) v ( t 0 ) ≤ u ( t 0 ) v(t_0)\leq u(t_0) v(t0)u(t0)时, v ( t ) ≤ u ( t ) v(t)\leq u(t) v(t)u(t)

Theorem 4.10. Let x = 0 x=0 x=0 be an equilibrium point for x ˙ = f ( t , x ) \dot x=f(t,x) x˙=f(t,x) and D ⊂ R n D\subset \mathbb R^n DRn be a domain containing x = 0 x=0 x=0. Let V : [ 0 , ∞ ) × D → R V:[0,\infty)\times D\to \mathbb R V:[0,)×DR be a continuously differentiable function such that
k 1 ∥ x ∥ α ≤ V ( t , x ) ≤ k 2 ∥ x ∥ α , ∂ V ∂ t + ∂ V ∂ x f ( t , x ) ≤ − k 3 ∥ x ∥ α , \begin{aligned} k_1\|x\|^\alpha\leq V(t,x)&\leq k_2\|x\|^\alpha,\\ \frac{\partial V}{\partial t}+\frac{\partial V}{\partial x}f(t,x)&\leq -k_3\|x\|^\alpha, \end{aligned} k1xαV(t,x)tV+xVf(t,x)k2xα,k3xα,
∀ t ≥ 0 \forall t\geq 0 t0 and ∀ x ∈ D \forall x\in D xD, where k 1 k_1 k1, k 2 k_2 k2, k 3 k_3 k3, and a a a are positive constants. Then, x = 0 x=0 x=0 is exponentially stable. If the assumptions hold globally, then x = 0 x=0 x=0 is globally exponentially stable.

可以知道,当上述定理中的条件满足时,我们有 V ˙ ≤ − k 3 k 2 V \dot V\leq -\frac{k_3}{k_2}V V˙k2k3V,即不光指数收敛,且收敛速度不小于 k 3 k 2 \frac{k_3}{k_2} k2k3

由Lemma 3.4可知,
V ( t , x ( t ) ) ≤ V ( t 0 , x ( t 0 ) ) e − ( k 3 / k 2 ) ( t − t 0 ) 。 V(t,x(t))\leq V(t_0,x(t_0))e^{-(k_3/k_2)(t-t_0)}。 V(t,x(t))V(t0,x(t0))e(k3/k2)(tt0)
因此,
∥ x ( t ) ∥ ≤ [ V ( t , x ( t ) ) k 1 ] 1 / α ≤ [ V ( t 0 , x ( t 0 ) ) e − ( k 3 / k 2 ) ( t − t 0 ) k 1 ] 1 / α ≤ [ k 2 ∥ x ( t 0 ) ∥ α e − ( k 3 / k 2 ) ( t − t 0 ) k 1 ] 1 / α = ( k 2 k 1 ) 1 / α ∥ x ( t 0 ) ∥ e − ( k 3 / k 2 a ) ( t − t 0 ) 。 \begin{aligned} \|x(t)\|&\leq \left[\frac{V(t,x(t))}{k_1}\right]^{1/\alpha}\leq\left[\frac{V(t_0,x(t_0))e^{-(k_3/k_2)(t-t_0)}}{k_1}\right]^{1/\alpha}\\ &\leq \left[\frac{k_2\|x(t_0)\|^\alpha e^{-(k_3/k_2)(t-t_0)}}{k_1}\right]^{1/\alpha}=\left(\frac{k_2}{k_1}\right)^{1/\alpha}\|x(t_0)\|e^{-(k_3/k_2a)(t-t_0)}。 \end{aligned} x(t)[k1V(t,x(t))]1/α[k1V(t0,x(t0))e(k3/k2)(tt0)]1/α[k1k2x(t0)αe(k3/k2)(tt0)]1/α=(k1k2)1/αx(t0)e(k3/k2a)(tt0)

微分方程求解

使用Lemma 3.4证明收敛性,本质是把一个复杂的微分方程求解问题,转化成一个相对容易的微分方程来求解。

第一节所看论文中证明有界性时的一个问题为例。已知
x ˙ ≤ a ( 1 + x ) + b ( 1 + x ) 2 ,   x ( 0 ) = 0 \dot x\leq a(1+x)+b(1+x)^2,\,x(0)=0 x˙a(1+x)+b(1+x)2,x(0)=0
现在要证明 x x x在时间 τ \tau τ内有界 ζ \zeta ζ,并求出 τ \tau τ的值。

应用Lemma 3.4,若存在 y ˙ = a ( 1 + y ) + b ( 1 + y ) 2 \dot y=a(1+y)+b(1+y)^2 y˙=a(1+y)+b(1+y)2 y ( 0 ) = 0 y(0)=0 y(0)=0,那么 x ≤ y x\leq y xy ∀ t ≥ 0 \forall t\geq 0 t0

分离变量,求解微分方程,参考步骤4如下
t + C = ∫ d t = ∫ d y a ( 1 + y ) + b ( 1 + y ) 2 = ∫ d y b ( 1 + y + a 2 b ) 2 − a 2 4 b = 1 b ∫ d z z 2 − a 2 4 b 2 , ( z = 1 + y + a 2 b ) = 1 a ∫ ( d z z − a 2 b − d z z + a 2 b ) = 1 a ln ⁡ ∣ z − a 2 b ∣ − 1 a ln ⁡ ∣ z + a 2 b ∣ = 1 a ln ⁡ ∣ 1 + y ∣ − 1 a ln ⁡ ∣ 1 + y + a b ∣ \begin{aligned} t+C=\int dt &=\int \frac{dy}{a(1+y)+b(1+y)^2}\\ &=\int \frac{dy}{b\left(1+y+\frac{a}{2b}\right)^2-\frac{a^2}{4b}}\\ &=\frac{1}{b}\int \frac{dz}{z^2-\frac{a^2}{4b^2}} ,\quad \left(z=1+y+\frac{a}{2b}\right)\\ &=\frac{1}{a}\int \left(\frac{dz}{z-\frac{a}{2b}}-\frac{dz}{z+\frac{a}{2b}}\right)\\ &=\frac{1}{a}\ln \left|z-\frac{a}{2b}\right|-\frac{1}{a}\ln \left|z+\frac{a}{2b}\right|\\ &=\frac{1}{a}\ln \left|1+y\right|-\frac{1}{a}\ln \left|1+y+\frac{a}{b}\right| \end{aligned} t+C=dt=a(1+y)+b(1+y)2dy=b(1+y+2ba)24ba2dy=b1z24b2a2dz,(z=1+y+2ba)=a1(z2badzz+2badz)=a1lnz2baa1lnz+2ba=a1ln1+ya1ln1+y+ba
假设 y , a , b ≥ 0 y,a,b\geq 0 y,a,b0。令 y = t = 0 y=t=0 y=t=0,可得 a C = ln ⁡ ( b a + b ) aC=\ln (\frac{b}{a+b}) aC=ln(a+bb),则有
e a t + a C = b a + b e a t = b y + b b y + a + b e^{at+aC}=\frac{b}{a+b}e^{at}=\frac{by+b}{by+a+b} eat+aC=a+bbeat=by+a+bby+b
变换为 y y y关于 t t t的函数
y ( t , 0 ) = ( a + b ) ( e a t − 1 ) − b e a t + a + b y(t,0)=\frac{(a+b)(e^{at}-1)}{-be^{at}+a+b} y(t,0)=beat+a+b(a+b)(eat1)
再令 y ( τ , 0 ) = ζ y(\tau,0)=\zeta y(τ,0)=ζ,得到
τ = 1 a ln ⁡ ( 1 + a ζ a + b ( 1 + ζ ) ) \tau=\frac{1}{a}\ln\left(1+\frac{a\zeta}{a+b(1+\zeta)}\right) τ=a1ln(1+a+b(1+ζ)aζ)


  1. Kia, S. S., Cortés, J., & Martínez, S. (2015). Distributed convex optimization via continuous-time coordination algorithms with discrete-time communication. In Automatica (Vol. 55, pp. 254–264). Elsevier Ltd. https://doi.org/10.1016/j.automatica.2015.03.001 ↩︎

  2. Jakob_Hu. 线性代数(14)——正交性、标准正交基和投影. https://blog.csdn.net/Jakob_Hu/article/details/90813435 ↩︎

  3. Khalil, H. K. (2002). Nonlinear systems (3rd ed.). Prentice Hall, ISBN: 0130673897. ↩︎

  4. 积分(反导数)计算器. https://zs.symbolab.com/solver/integral-calculator ↩︎

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值