无处不在的Schur补:凸优化角度的证明

前言

之前在各类应用中接触到了 Schur补, 即舒尔补这个概念。 而下定决心写一篇博客来记录, 是由于在 压缩感知的尽头: 原子范数最小化 又一次充分应用到了 Schur 补。 似乎, 这和 矩阵的 半正定性, 和 SDP 的充分使用,密不可分。 因此, 有足够的理由深入了解。

参考的书籍为: Convex Optimization for Signal Processing and Communications: From Fundamentals to Applications.

无疑是凸优化的一本好书, 和Boyd的著作相比, 完全称得上是各有千秋。 后续的许多博客, 可能也会介绍其中的精华内容。

Schur 补

假设 C ∈ S + + m , A ∈ S n \mathbf{C} \in \mathbb{S}_{++}^{m}, \mathbf{A} \in \mathbb{S}^{n} CS++m,ASn, 即前者为正定矩阵, 后者为对称矩阵。那么:
S ≜ [ A B B T C ] ⪰ 0 ,  当且仅当  S C ≜ A − B C − 1   B T ⪰ 0 \mathrm{S} \triangleq\left[\begin{array}{cc} \mathrm{A} & \mathrm{B} \\ \mathrm{B}^{\mathrm{T}} & \mathrm{C} \end{array}\right] \succeq 0, \text { 当且仅当 } \mathrm{S}_{\mathrm{C}} \triangleq \mathrm{A}-\mathrm{BC}^{-1} \mathrm{~B}^{\mathrm{T}} \succeq 0 S[ABTBC]0, 当且仅当 SCABC1 BT0
其中, S C \mathrm{S}_{\mathrm{C}} SC 被称为 Schur 补。 可以看到, 此处要求 C \mathbf{C} C 矩阵必须可逆, 这也是一开始要求其为正定矩阵的原因。

证明:必要性

由于 S ⪰ 0 \mathbf{S}\succeq 0 S0, 根据半正定矩阵的定义, 有:
f ( x , y ) = [ x T    y T ] S [ x y ] = [ x T    y T ] [ A B B T C ] [ x y ] ⩾ 0 , ∀ ( x , y ) ∈ R n + m \begin{aligned} f(\mathbf{x}, \mathbf{y}) &=\left[\mathbf{x}^{\mathrm{T}} \;\mathbf{y}^{\mathrm{T}}\right] \mathbf{S}\left[\begin{array}{l} \mathbf{x} \\ \mathbf{y} \end{array}\right] \\ &=\left[\mathbf{x}^{\mathrm{T}}\; \mathbf{y}^{\mathrm{T}}\right]\left[\begin{array}{cc} \mathbf{A} & \mathbf{B} \\ \mathbf{B}^{\mathrm{T}} & \mathbf{C} \end{array}\right]\left[\begin{array}{l} \mathbf{x} \\ \mathbf{y} \end{array}\right] \geqslant 0, \forall(\mathbf{x}, \mathbf{y}) \in \mathbb{R}^{n+m} \end{aligned} f(x,y)=[xTyT]S[xy]=[xTyT][ABTBC][xy]0,(x,y)Rn+m
这是 关于 f ( x , y ) f(\mathbf{x}, \mathbf{y}) f(x,y) 的凸函数, 因为这是个二次型函数,而矩阵 S \mathbf{S} S 半正定, 因此可由二阶条件直接得到。 再考虑函数:
g ( x ) = inf ⁡ y ∈ R m f ( x , y ) ⩾ 0 (1) g(\mathbf{x})=\inf _{\mathbf{y} \in \mathbb{R}^{m}} f(\mathbf{x}, \mathbf{y}) \geqslant 0 \tag{1} g(x)=yRminff(x,y)0(1)
注意到 g ( x ) g(x) g(x)可以视为 f ( x , y ) f(x,y) f(x,y)在非空凸集中的逐点下确界。因此, g ( x ) g(x) g(x) 也是凸函数 (逐点下确界法则)。 同时注意到,
f ( x , y ) = x T A x + 2 x T B y + y T C y f(\mathbf{x}, \mathbf{y})=\mathbf{x}^{\mathrm{T}} \mathbf{A} \mathbf{x}+2 \mathbf{x}^{\mathrm{T}} \mathbf{B} \mathbf{y}+\mathbf{y}^{\mathrm{T}} \mathbf{C y} f(x,y)=xTAx+2xTBy+yTCy
因此当固定 x x x 时, f f f 对于 y y y 是个凸函数 (因为二次型函数, C \mathbf{C} C 为正定)。因此,要找出 (1) 中的下界, 先对 y y y 求梯度:
∇ y f ( x , y ) = 2 B T x + 2 C y = 0 ⇒ y ⋆ = − C − 1 B T x \nabla_{\mathbf{y}} f(\mathbf{x}, \mathbf{y})=2 \mathbf{B}^{\mathrm{T}} \mathbf{x}+2 \mathbf{C y}=\mathbf{0} \Rightarrow \mathbf{y}^{\star}=-\mathbf{C}^{-1} \mathbf{B}^{\mathrm{T}} \mathbf{x} yf(x,y)=2BTx+2Cy=0y=C1BTx
将其代入 (1), 有:
g ( x ) = f ( x , y ∗ ) = x T A x − 2 x T B C − 1 B T x + x T B C − 1 B T x = x T ( A − B C − 1 B T ) x = x T S C x ≥ 0 , ∀ x ∈ R n \begin{aligned} g(\mathbf{x}) &=f\left(\mathbf{x}, \mathbf{y}^{*}\right) \\ &=\mathbf{x}^{\mathrm{T}} \mathbf{A} \mathbf{x}-2 \mathbf{x}^{\mathrm{T}} \mathbf{B} \mathbf{C}^{-1} \mathbf{B}^{\mathrm{T}} \mathbf{x}+\mathbf{x}^{\mathrm{T}} \mathbf{B} \mathbf{C}^{-1} \mathbf{B}^{\mathrm{T}} \mathbf{x} \\ &=\mathbf{x}^{\mathrm{T}}\left(\mathbf{A}-\mathbf{B} \mathbf{C}^{-1} \mathbf{B}^{\mathrm{T}}\right) \mathbf{x}=\mathbf{x}^{\mathrm{T}} \mathbf{S}_{\mathbf{C}} \mathbf{x} \ge 0, \quad \forall \mathbf{x} \in \mathbb{R}^{n} \end{aligned} g(x)=f(x,y)=xTAx2xTBC1BTx+xTBC1BTx=xT(ABC1BT)x=xTSCx0,xRn
因此, S C \mathbf{S}_\mathbf{C} SC 为半正定矩阵。 至此, 必要性得证。

证明:充分性

S C ⪰ 0 \mathbf{S}_\mathbf{C}\succeq0 SC0 时, 直接有
g ( x ) ≥ 0 , ∀ x ∈ R n g(x)\ge 0, \forall \mathbf{x}\in\mathbb{R}^n g(x)0,xRn
f ( x , y ) ≥ g ( x ) f(x,y)\ge g(x) f(x,y)g(x), 因为 g ( x ) g(x) g(x) 的定义就是 f ( x , y ) f(x,y) f(x,y) 的下确界。 因此, S ⪰ 0 \mathbf{S}\succeq 0 S0 显然成立。 充分性得证。

拓展

C \mathbf{C} C 为半正定时, Schur补变为: S C = A − B C † B T \mathrm{S}_{\mathbf{C}}=\mathbf{A}-\mathbf{B C}^{\dagger} \mathbf{B}^{\mathrm{T}} SC=ABCBT
结论仍成立。

类似的推导下, 也可以有:
S ≜ [ A B B T C ] ⪰ 0 ,  当且仅当  S A ≜ C − B T A − 1   B ⪰ 0 \mathrm{S} \triangleq\left[\begin{array}{cc} \mathrm{A} & \mathrm{B} \\ \mathrm{B}^{\mathrm{T}} & \mathrm{C} \end{array}\right] \succeq 0, \quad \text { 当且仅当 } \mathrm{S}_{\mathrm{A}} \triangleq \mathrm{C}-\mathrm{B}^{\mathrm{T}} \mathrm{A}^{-1} \mathrm{~B} \succeq 0 S[ABTBC]0, 当且仅当 SACBTA1 B0

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

B417科研笔记

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值