从少量噪声时间样本中求取复指数叠加的频率和相对相位是统计信号处理中的一个基础问题
原子范数
原子范数定义为:
∣
∣
x
∣
∣
A
=
inf
{
t
>
0
:
x
∈
t
c
o
n
v
(
A
)
}
||x||_A = \inf \{t > 0: x ∈ tconv(\mathcal A)\}
∣∣x∣∣A=inf{t>0:x∈tconv(A)}
A
.
\mathcal{A}.
A. 为原子的集合,满足其凸包
c
o
n
v
(
A
)
conv(\mathcal A)
conv(A) 是紧致的,中心对称的,并且包含原点作为内点。
当集合
A
\mathcal A
A 是单位范数 1-sparse 元素的集合时,原子范数为
l
1
l_1
l1 范数。 类似地,当集合
A
\mathcal A
A 为 rank-1 的矩阵的集合时,原子范数就是核范数。
假设观察到信号 y = x ∗ + w \textcolor{red}{y=x^*+w} y=x∗+w ,并且先验的知道 x ∗ x^* x∗ 可以写成 A \mathcal A A 中几个原子的线性组合。
Lemma 1(最优条件)
1.
∣
∣
y
−
x
^
∣
∣
A
∗
≤
τ
.
1.||y-\hat x||_\mathcal A^*\le \tau \space.
1.∣∣y−x^∣∣A∗≤τ .
2.
⟨
y
−
x
^
,
x
^
⟩
=
τ
∣
∣
x
^
∣
∣
A
.
2.\lang y-\hat x,\hat x \rang=\tau ||\hat x||_\mathcal A.
2.⟨y−x^,x^⟩=τ∣∣x^∣∣A.
在上述条件下,
min
x
∣
∣
x
−
y
∣
∣
2
2
+
τ
∣
∣
x
∣
∣
A
.
\underset{\mathcal{\mathcal x}}{\min} ||\mathcal x-y||_2^2+\tau ||x||_\mathcal A.
xmin∣∣x−y∣∣22+τ∣∣x∣∣A.的解为
x
^
\hat x
x^。对偶范数为:
∣
∣
z
∣
∣
A
∗
=
sup
∣
∣
x
∣
∣
A
≤
1
⟨
z
,
α
⟩
.
||z||_{\mathcal A}^*=\sup_{\substack{||x||_\mathcal A \le1}}\lang\mathcal z,\mathcal \alpha \rang.
∣∣z∣∣A∗=∣∣x∣∣A≤1sup⟨z,α⟩.这意味着
⟨
x
,
z
⟩
≤
∣
∣
x
∣
∣
A
∣
∣
z
∣
∣
A
∗
\lang x,z\rang\le||x||_\mathcal A\space||z||_\mathcal A^*
⟨x,z⟩≤∣∣x∣∣A ∣∣z∣∣A∗, 因为上式的上确界是可确定的,因此对于任意一个 a 都有一个 z 使其相等。
由于
A
\mathcal A
A 包含
{
x
:
∣
∣
x
∣
∣
A
≤
1
}
\{ x:||x||_{\mathcal A} \le 1\}
{x:∣∣x∣∣A≤1} 所有的极值点,因此保证最优解实际上位于集合
A
\mathcal A
A 中:
∣
∣
z
∣
∣
A
∗
=
sup
α
∈
A
⟨
z
,
α
⟩
.
||z||_{\mathcal A}^*=\sup_{\substack{\mathcal \alpha \in \mathcal A}}\lang\mathcal z,\mathcal \alpha \rang.
∣∣z∣∣A∗=α∈Asup⟨z,α⟩. 对偶范数将在整个过程中发挥关键作用,因为渐近误差率将以噪声过程的对偶原子范数表示。
Lemma 2(对偶问题)
min
x
∣
∣
x
−
y
∣
∣
2
2
+
τ
∣
∣
x
∣
∣
A
\underset{\mathcal{\mathcal x}}{\min} ||\mathcal x-y||_2^2+\tau ||x||_\mathcal A
xmin∣∣x−y∣∣22+τ∣∣x∣∣A的对偶问题为:
max
z
1
2
(
∣
∣
y
∣
∣
2
2
−
∣
∣
y
−
z
∣
∣
2
2
)
,
s
u
b
j
e
c
t
t
o
∣
∣
z
∣
∣
A
∗
≤
z
.
\underset{\mathcal{\mathcal z}}{\max} \frac 1 2(||y||_2^2-||\mathcal y-z||_2^2),subject \space to\space||z||_\mathcal A^*\le z.
zmax21(∣∣y∣∣22−∣∣y−z∣∣22),subject to ∣∣z∣∣A∗≤z.初始问题的解
x
^
\hat x
x^ 和对偶问题的解
z
^
\hat z
z^ 的最优性条件和规定没有无对偶间隙:
i
)
y
=
x
^
+
z
^
.
i)y=\hat x+\hat z.
i)y=x^+z^.
i
i
)
∣
∣
z
∣
∣
A
∗
≤
τ
.
ii)||z||_\mathcal A^*\le \tau.
ii)∣∣z∣∣A∗≤τ.
i
i
i
)
⟨
z
^
,
x
^
⟩
=
τ
∣
∣
x
^
∣
∣
A
.
iii)\lang \hat z,\hat x \rang=\tau||\hat x||_\mathcal A.
iii)⟨z^,x^⟩=τ∣∣x^∣∣A.
推论1:假设一些
S
⊂
A
S \sub\mathcal A
S⊂A,
z
^
\hat z
z^是对偶问题的解,满足:
1)
⟨
z
^
,
a
⟩
=
τ
w
h
e
n
e
v
e
r
a
∈
S
.
\lang \hat z,a \rang=\tau \space whenever \space a \in S.
⟨z^,a⟩=τ whenever a∈S.
2)
∣
⟨
z
^
,
a
⟩
∣
<
τ
i
f
a
∉
S
.
|\lang \hat z,a \rang|<\tau \space if \space a \notin S.
∣⟨z^,a⟩∣<τ if a∈/S.
然后,任意的解
x
^
\hat x
x^可以分解为
x
^
=
∑
a
∈
S
c
a
a
\hat x=\sum_{a\in S}c_a a
x^=∑a∈Scaa ,
(
∣
∣
x
^
∣
∣
A
=
∑
a
∈
S
c
a
)
\space(||\hat x||_\mathcal A=\sum_{a\in S}c_a)
(∣∣x^∣∣A=∑a∈Sca).
因此,对偶解
z
^
\hat z
z^ 提供了一种确定将
x
^
\hat x
x^ 分解为一组基本原子的方法,该基本原子实现了
x
^
\hat x
x^ 的原子范数。事实上,我们可以计算内积
⟨
z
^
,
x
⟩
\lang \hat z,x\rang
⟨z^,x⟩,并确定内积的绝对值为
τ
\tau
τ 的原子。
当SNR高时,期望在某些假设下以这种方式识别的分解应该接近
x
∗
x^*
x∗ 的原始分解。
P1(正则化参数的MSE的上界的最优选择):
如果正则化参数
τ
>
∣
∣
w
∣
∣
A
∗
\tau>||w||_\mathcal A^*
τ>∣∣w∣∣A∗,
x
^
\hat x
x^ 的最优解有 MSE:
1
n
∣
∣
x
^
−
x
∗
∣
∣
2
2
≤
1
n
(
τ
∣
∣
x
∗
∣
∣
A
−
⟨
x
∗
,
w
⟩
≤
2
π
n
∣
∣
x
∗
∣
∣
A
)
.
\frac 1 n ||\hat x- x^*||_2^2\le\frac 1 n(\tau||x^*||_\mathcal A-\lang x^*,w\rang\le \frac {2\pi} n ||x^*||_\mathcal A).
n1∣∣x^−x∗∣∣22≤n1(τ∣∣x∗∣∣A−⟨x∗,w⟩≤n2π∣∣x∗∣∣A).
线谱估计
对复正弦曲线的线性组合进行降噪。原子集合由各个正弦曲线的样本组成,
a
f
,
ϕ
∈
C
n
a_{f,\phi}\in \mathbb C^n
af,ϕ∈Cn:
a
f
,
ϕ
=
e
i
2
π
ϕ
[
1
e
i
2
π
f
.
.
.
e
i
2
π
(
n
−
1
)
f
]
T
.
a_{f,\phi}=e^{i2\pi\phi}[1\space e^{i2\pi f}\space...\space e^{i2\pi(n-1)f}]^T.
af,ϕ=ei2πϕ[1 ei2πf ... ei2π(n−1)f]T.无限的原子集
A
=
{
a
f
,
ϕ
:
f
⊂
[
0
,
1
]
,
ϕ
⊂
[
0
,
1
]
}
\mathcal A=\{ a_{f,\phi}:f\sub[0,1],\phi\sub[0,1] \}
A={af,ϕ:f⊂[0,1],ϕ⊂[0,1]} 组成了
x
∗
x^*
x∗ 适当的原子集合,
x
∗
x^*
x∗ 在对偶问题中可以写成一个稀疏的非负的原子组合。
x
∗
=
∑
l
=
1
k
c
l
∗
a
f
l
∗
,
0
=
∑
l
=
1
k
∣
c
l
∗
∣
a
f
l
∗
,
ϕ
l
x^*=\sum_{l=1}^k c_l^*a_{f_l^*,0}=\sum_{l=1}^k|c_l^*|a_{f_l^*,\phi_l}
x∗=∑l=1kcl∗afl∗,0=∑l=1k∣cl∗∣afl∗,ϕl,其中
c
l
∗
=
∣
c
l
∗
∣
e
i
2
π
ϕ
l
c_l^*=|c_l^*|e^{i2\pi\phi_l}
cl∗=∣cl∗∣ei2πϕl
相应的对偶范数采用直观的形式: ∣ ∣ v ∣ ∣ A ∗ = sup f , ϕ ⟨ v , a f , ϕ ⟩ = sup f ∈ [ 0 , 1 ] sup ϕ ∈ [ 0 , 1 ] e i 2 π ϕ ∑ l = 0 n − 1 v l e − 2 π i l f = sup ∣ z ∣ < 1 ∣ ∑ l = 0 n − 1 v l z l ∣ . ||v||_\mathcal A^*=\sup_{\substack f,\phi}\lang v,a_{f,\phi} \rang=\sup_{\substack f\in[0,1]}\sup_{\substack \phi\in[0,1]}e^{i2\pi\phi}\sum_{l=0}^{n-1}v_le^{-2\pi ilf}=\sup_{\substack |z|<1}|\sum_{l=0}^{n-1}v_lz^l|. ∣∣v∣∣A∗=f,ϕsup⟨v,af,ϕ⟩=f∈[0,1]supϕ∈[0,1]supei2πϕl=0∑n−1vle−2πilf=∣z∣<1sup∣l=0∑n−1vlzl∣.换句话说, ∣ ∣ v ∣ ∣ A ∗ ||v||_\mathcal A^* ∣∣v∣∣A∗ 是多项式 ζ ↦ ∑ l = 0 n − 1 v l ζ l . \zeta \mapsto \sum_{l=0}^{n-1} v_l\zeta^l. ζ↦∑l=0n−1vlζl. 在单位圆上获得的最大绝对值。
A.原子软阈值SDP
给出了与线谱原子集
A
=
{
a
f
,
ϕ
∣
f
∈
[
0
,
1
]
,
ϕ
∈
[
0
,
1
]
}
\mathcal A=\{a_{f,\phi}|f\in[0,1],\phi\in[0,1]\}
A={af,ϕ∣f∈[0,1],ϕ∈[0,1]} 相关的原子范数的半定刻画,由上面的式子可以知道,向量
v
∈
C
n
v\in\mathbb C^n
v∈Cn 的对偶原子范数是复数三角多项式
V
(
f
)
=
∑
l
=
0
n
−
1
v
l
e
i
2
π
l
f
V(f)=\sum_{l=0}^{n-1} v_le^{i2\pi lf}
V(f)=∑l=0n−1vlei2πlf 的最大绝对值。
因此,对对偶原子范数的约束等价于对
V
(
f
)
V(f)
V(f) 的大小的限制:
∣
∣
v
∣
∣
A
∗
≤
τ
⇔
∣
V
(
f
)
∣
2
≤
τ
2
,
∀
f
∈
[
0
,
1
]
.
||v||_\mathcal A^*\le\tau \Leftrightarrow |V(f)|^2 \le \tau^2,\forall f \in [0,1].
∣∣v∣∣A∗≤τ⇔∣V(f)∣2≤τ2,∀f∈[0,1].函数
q
(
f
)
=
τ
2
−
∣
V
(
f
)
∣
2
q(f)=\tau^2-|V(f)|^2
q(f)=τ2−∣V(f)∣2 是一个三角多项式(|z|=1时,变量
z
z
z 和
z
∗
z^*
z∗ 的多项式)。
q
(
f
)
q(f)
q(f) 为非负的一个充分必要条件是它可以写成三角多项式的平方和。
定义一个映射
T
:
C
n
→
C
n
×
n
T:\mathbb C^n \to \mathbb C^{n\times n}
T:Cn→Cn×n,它从输入中创建一个Hermitian Toeplitz矩阵,即
T
(
x
)
=
[
x
1
x
2
.
.
.
x
n
x
2
∗
x
1
.
.
.
x
n
−
1
⋮
⋮
⋱
⋮
x
n
∗
x
n
−
1
∗
.
.
.
x
1
]
T(x)=\begin{bmatrix}x_1& x_2&...&x_n\\x_2^* & x_1&...&x_{n-1}\\ \vdots &\vdots & \ddots &\vdots \\x_n^* &x_{n-1}^*&...&x_1 \end{bmatrix}
T(x)=
x1x2∗⋮xn∗x2x1⋮xn−1∗......⋱...xnxn−1⋮x1
Lemma 4: 对于任何给定的因果三角多项式
V
(
f
)
=
∑
l
=
0
n
−
1
v
l
e
i
2
π
l
f
,
∣
V
(
f
)
∣
<
τ
.
V(f)=\sum_{l=0}^{n-1} v_le^{i2\pi lf},|V(f)|<\tau.
V(f)=∑l=0n−1vlei2πlf,∣V(f)∣<τ. 当且仅当存在复 Hermitian 矩阵Q使得
T
∗
(
Q
)
=
τ
2
e
1
a
n
d
[
Q
v
v
∗
1
]
⪰
0.
T^*(Q)=\tau^2e_1\space and \space \begin {bmatrix} Q &v\\ v^*&1\end{bmatrix}\succeq 0.
T∗(Q)=τ2e1 and [Qv∗v1]⪰0.
e
1
e_1
e1 是第一个标准基向量,其在第一个分量处为 1 并且在其他地方为 0。重写原子范数
∣
∣
x
∣
∣
A
=
sup
∣
∣
v
∣
∣
A
∗
≤
1
⟨
x
,
v
⟩
||x||_{\mathcal A}=\sup_{\substack{||v||_\mathcal A^* \le1}}\lang\mathcal x,\mathcal v \rang
∣∣x∣∣A=sup∣∣v∣∣A∗≤1⟨x,v⟩ 为下面的半定规划问题:
max
v
,
Q
⟨
x
,
v
⟩
s
u
b
j
e
c
t
t
o
T
∗
(
Q
)
=
e
1
a
n
d
[
Q
v
v
∗
1
]
⪰
0.
\max_{\substack v,Q}\lang x,v\rang \space subject \space to \space T^*(Q)=e_1 \space and\space \begin {bmatrix} Q &v\\ v^*&1\end{bmatrix}\succeq 0.
v,Qmax⟨x,v⟩ subject to T∗(Q)=e1 and [Qv∗v1]⪰0.上面的对偶问题(after a trivial rescaling)于是等于
x
x
x 的原子范数:
∣
∣
x
∣
∣
A
=
min
t
,
u
1
2
(
t
+
u
1
)
s
u
b
j
e
c
t
t
o
[
T
(
u
)
x
x
∗
t
]
⪰
0.
||x||_\mathcal A=\min_{\substack t,u} \frac 1 2(t+u_1)\space subject\space to \begin {bmatrix} T(u) &x\\ x^*& t\end{bmatrix}\succeq 0.
∣∣x∣∣A=t,umin21(t+u1) subject to[T(u)x∗xt]⪰0.半定程序可以通过现成的求解器来求解。
B.选择正则化参数
正则化参数的选择取决于噪声模型,正则化参数的最佳选择取决于噪声的对偶范数。当我们考虑单位圆上 n 个均匀间隔点的最大值时,对偶范数的期望一个简单下界出现。
n
≥
5
n\geq 5
n≥5 时下界为:
σ
n
log
(
n
)
−
n
2
log
(
4
π
log
(
n
)
)
.
\sigma \sqrt{\smash[b]{n\log (n)-\frac n 2\log (4\pi\log(n))}}.
σnlog(n)−2nlog(4πlog(n)).
n
>
3
n>3
n>3 时的噪声的期望对偶范数的一个非渐近上界:
σ
(
1
+
1
log
(
n
)
)
n
log
(
n
)
+
n
log
(
4
π
log
(
n
)
)
.
\sigma(1+\frac 1 {\log(n)})\sqrt{n\log(n)+n\log(4\pi\log(n))}.
σ(1+log(n)1)nlog(n)+nlog(4πlog(n)).
C.确定频率
对偶解可用于识别原始解的频率。对于线谱估计,当且仅当
∣
⟨
z
^
,
a
f
,
ϕ
⟩
∣
=
∣
∑
l
=
0
n
−
1
z
^
l
e
i
2
π
l
f
∣
=
τ
.
|\lang \hat z , a_{f,\phi}\rang|=|\sum_{l=0}^{n-1}\hat z_l e^{i2\pi lf}|=\tau.
∣⟨z^,af,ϕ⟩∣=∣l=0∑n−1z^lei2πlf∣=τ.时,一个频率
f
∈
[
0
,
1
]
f\in[0,1]
f∈[0,1] 是对偶多项式模的最大值点,可以得出估计的信号值
x
^
\hat x
x^。可以通过找到对偶多项式达到幅度
τ
\tau
τ 的频率
f
f
f 来确定。
在无噪声情况下,如果频率之间的最小间隔至少为
4
/
n
4/n
4/n,则由对偶多项式定位的频率是精确的,其中
n
n
n 是线谱信号中的样本数。
D.离散化和 LASSO
用Lasso作为半定规划的替代方案,减小复杂度。选择一个均匀的频率数为 N N N 的网格 A N = { a m / N , ϕ ∣ 0 ≤ m ≤ N − 1 } ⊂ A \mathcal A_N=\{ a_{m/N,\phi} | 0 \le m \le N-1 \}\sub \mathcal A AN={am/N,ϕ∣0≤m≤N−1}⊂A,在这个网格上并求解 x ^ \hat x x^ : min ∣ ∣ x − y ∣ ∣ 2 2 + τ ∣ ∣ x ∣ ∣ A N . {\min} ||\mathcal x-y||_2^2+\tau ||x||_{\mathcal A_N}. min∣∣x−y∣∣22+τ∣∣x∣∣AN.定义 Φ \Phi Φ为大小为 n × N n\times N n×N 的 Fourier矩阵,其第 m 列为 a m / N , 0 a_{m/N,0} am/N,0。对于任意的 x ∈ C n x\in\mathbb C^n x∈Cn,有 ∣ x ∣ A N = min { ∣ ∣ c ∣ ∣ 1 : x = Φ c } |x|_{\mathcal A_N}=\min\{ ||c||_1:x=\Phi c \} ∣x∣AN=min{∣∣c∣∣1:x=Φc} .因此,对于最优点 c ^ \hat c c^和集合 x ^ N = Φ c ^ \hat x_N=\Phi \hat c x^N=Φc^ 或 c ^ \hat c c^ 的 N N N 项离散傅里叶变换(DFT)的前 n n n 项: min 1 2 ∣ ∣ Φ c − y ∣ ∣ 2 2 + τ ∣ ∣ c ∣ ∣ 1 . \min \frac 1 2|| \Phi c-y ||_2^2 + \tau||c||_1. min21∣∣Φc−y∣∣22+τ∣∣c∣∣1. 此外, z ∈ C n z\in \mathbb C^n z∈Cn, Φ ∗ z \Phi^*z Φ∗z 表示其 N N N 项 离散傅里叶反变换(IDFT)。