《Fractional Programming for Communication Systems—Part I: Power Control and Beamforming》
本文地址:https://arxiv.org/abs/1802.10192
前言
该文章为对上述论文的阅读笔记,一点戳见,不吝赐教。
FP背景
FP是一类包含比例项的优化问题,经济学、管理学、信息科学、光学、图论和计算机科学等广泛领域都对它进行了广泛的研究。
本文档是目的是将FP的应用扩展到通信系统设计中更广泛的优化问题,特别是功率控制、波束形成和用户调度等通常不能直接用比例形式表示的优化问题。
通常关注的是数据速率计算为 log ( 1 + SINR ) \text{log}(1 + \text{SINR}) log(1+SINR)的通信系统,SINR表示的是信干噪比(signal-to-interference-plus-noise ratio)。SINR在通信系统中的突出作用使得FP是网络设计和优化的宝贵工具,整个讨论集中在无线蜂窝网络,但它可以很容易地适应许多其他网络(例如,光网络或数字用户线路)。
- 为何依然要研究FP问题在无线蜂窝网络的应用?
尽管存在大多数关于FP的工作,但大多数工作是针对的单比问题(single-ratio)问题。而少数研究多比问题的工作(mltiple-ratio)的工作,它们又被限定在特定的形式(如,max-min问题)。而对于系统级通信网络设计,通常不得不应对多比问题,因为整个系统的性能通常是来自多个干扰链路的多个分数阶参数(如SINRs)的函数。求解多比的FP问题,是一个NP-hard问题,找到一个全局最优解十分耗费时间,甚至不可承担。对于求多比问题的驻点解,已知的方法只有连续凸逼近等通用方法。因此研究针对多比问题的FP十分有意义。
FP问题形式
给定一个非空约束集合( d ∈ N d \in \mathbb{N} d∈N,即: d d d为严格的正整数): X ⊆ R d \mathcal{X} \subseteq \mathbb{R}^{d} X⊆Rd,一个非负函数: A ( x ) : R d → R + A(\mathbf{x}):\mathbb{R}^{d} \rightarrow \mathbb{R}_{+} A(x):Rd→R+,一个正函数: B ( x ) : R d → R + + B(\mathbf{x}): \mathbb{R}^{d} \rightarrow \mathbb{R}_{++} B(x):Rd→R++,一个单比问题(maximizing)可以表示为:
maximize x A ( x ) B ( x ) subject to x ∈ X \begin{array}{ll} \underset{\mathrm{x}}{\operatorname{maximize}} & \frac{A(\mathrm{x})}{B(\mathrm{x})} \\ \text { subject to } & \mathrm{x} \in \mathcal{X} \end{array} xmaximize subject to B(x)A(x)x∈X
上述的单比问题通常是非凸的。传统的FP方法通常是把该单比形式转化为分子分母解耦的形式,联合优化 A ( x ) A(\mathbf{x}) A(x)和 B ( x ) B(\mathbf{x}) B(x),特别是对于: A ( x ) A(\mathbf{x}) A(x)为凸函数, B ( x ) B(\mathbf{x}) B(x)为凹函数, X \mathcal{X} X为凸集的形式,称为concave-convex FP问题。
经典的FP技术
1.Charnes-Cooper Transform
引入一个新的变量:
z
=
1
B
(
x
)
a
n
d
q
=
x
B
(
x
)
z=\frac{1}{B(\mathrm{x})} \quad and \quad \mathbf{q}=\frac{\mathbf{x}}{B(\mathbf{x})}
z=B(x)1andq=B(x)x
单比问题变为:
maximize
z
,
q
z
A
(
q
z
)
subject to
z
B
(
q
z
)
≤
1
z
∈
Z
q
∈
Q
\begin{array}{ll} \underset{z, \mathbf{q}}{\operatorname{maximize}} & z A\left(\frac{\mathbf{q}}{z}\right) \\ \text { subject to } & z B\left(\frac{\mathbf{q}}{z}\right) \leq 1 \\ & z \in \mathcal{Z} \\ & \mathbf{q} \in \mathcal{Q} \end{array}
z,qmaximize subject to zA(zq)zB(zq)≤1z∈Zq∈Q
其中, Z \mathcal{Z} Z和 Q \mathcal{Q} Q分别是 z z z和 q \mathbf{q} q的范围,且 x ∈ X \mathrm{x} \in \mathcal{X} x∈X原始的解 x \mathbf{x} x可以由 z z z和 q \mathbf{q} q恢复。
注意,这种方法通过将 B ( x ) B(\mathbf{x}) B(x)移动到约束 z B ( q z ) ≤ 1 z B\left(\frac{\mathbf{q}}{z}\right) \leq 1 zB(zq)≤1,而将 A ( x ) A(\mathbf{x}) A(x)留在目标中来解耦分母和分子。如果原始问题是concave-convex FP问题,那么通过该转换构造的凸问题可以被很好的解决。
针对Charnes-Cooper Transform需要注意的两个点:
- 引入了额外的约束
- Z \mathcal{Z} Z和 Q \mathcal{Q} Q需要表征出来,这可能不容易做到
该方法对于单比问题可以很好的解决,对于oncave-convex 单比FP问题事实上还能够收敛到全局最优。但拓展到多比问题(sum-of-ratios 问题)是十分困难的。
2.Dinkelbach’s Transform
该方法将单比问题转化为:
maximize
x
A
(
x
)
−
y
B
(
x
)
subject to
x
∈
X
\begin{array}{ll} \underset{\mathrm{x}}{\operatorname{maximize}} & A(\mathrm{x})-y B(\mathrm{x}) \\ \text { subject to } & \mathrm{x} \in \mathcal{X} \end{array}
xmaximize subject to A(x)−yB(x)x∈X
用一个新的辅助变量
y
y
y进行迭代更新,具体表示为:
y
[
t
+
1
]
=
A
(
x
[
t
]
)
B
(
x
[
t
]
)
y[t+1]=\frac{A(\mathbf{x}[t])}{B(\mathbf{x}[t])}
y[t+1]=B(x[t])A(x[t])
其中,
t
t
t是迭代的index。可以证明,通过交替更新
y
y
y和求解转换后的单比问题中的
x
\mathbf{x}
x可以证明收敛性是有保证的,因为y在每次迭代后都是非递减的。
该方法同样对于单比问题可以很好的解决,对于concave-convex 单比FP问题,固定 y y y优化 x \mathbf{x} x是一个凸问题,其能够收敛到原始单比问题的全局最优。
Dinkelbach’s Transform相较于Charnes-Cooper Transform没有额外的约束被引入。
一种新的变换方法:二次变换(Quadratic Transform)
利用这种二次变换,希望新的函数有一些性质:
- C1(Decoupling):新的目标函数具有如下的形式: g ( x , y ) = f ( A ( x ) ) q 1 ( y ) + h ( B ( x ) ) q 2 ( y ) g(\mathbf{x}, y)=f(A(\mathbf{x})) q_{1}(y)+h(B(\mathbf{x})) q_{2}(y) g(x,y)=f(A(x))q1(y)+h(B(x))q2(y)。
- C2(Equivalent Solution):当且仅当 x ⋆ \mathbf{x}^{\star} x⋆和 y ⋆ y^{\star} y⋆最大化 g ( x , y ) g(\mathbf{x}, y) g(x,y)时, x ⋆ \mathbf{x}^{\star} x⋆最大化 A ( x ) / B ( x ) A(\mathbf{x}) / B(\mathbf{x}) A(x)/B(x)。
- C3(Equivalent Objective):对于某个 x \mathbf{x} x,让 y ⋆ = arg max y g ( x , y ) y^{\star}=\arg \max _{y} g(\mathbf{x}, y) y⋆=argmaxyg(x,y),然后对于该 x \mathbf{x} x有 g ( x , y ⋆ ) = A ( x ) / B ( x ) g\left(\mathbf{x}, y^{\star}\right)=A(\mathbf{x}) / B(\mathbf{x}) g(x,y⋆)=A(x)/B(x)。
- C4(Concavity):对于固定的 x \mathbf{x} x, g ( x , y ) g(\mathbf{x}, y) g(x,y)关于 y y y是凹的,即: ∂ 2 g / ∂ y 2 ≤ 0 \partial^{2} g / \partial y^{2} \leq 0 ∂2g/∂y2≤0
理论1(Quadratic Transform)
二次转换:
g
(
x
,
y
)
=
2
y
A
(
x
)
−
y
2
B
(
x
)
g(\mathrm{x}, y)=2 y \sqrt{A(\mathrm{x})}-y^{2} B(\mathrm{x})
g(x,y)=2yA(x)−y2B(x)
满足:C1-C4。进一步地,如果C4被加强,其要求:
∂
2
g
/
∂
y
2
\partial^{2} g / \partial y^{2}
∂2g/∂y2是独立于
y
y
y的,则任何一个满足C1-C4的
g
(
x
,
y
)
g(\mathrm{x}, y)
g(x,y)必须满足如下形式:
g
(
x
,
y
)
=
2
(
t
1
y
+
t
2
)
A
(
x
)
−
(
t
1
y
+
t
2
)
2
B
(
x
)
g(\mathrm{x}, y)=2\left(t_{1} y+t_{2}\right) \sqrt{A(\mathrm{x})}-\left(t_{1} y+t_{2}\right)^{2} B(\mathrm{x})
g(x,y)=2(t1y+t2)A(x)−(t1y+t2)2B(x)
对于多比FP问题的二次转化:
sum-of-ratios问题表示为:
maximize
x
∑
m
=
1
M
A
m
(
x
)
B
m
(
x
)
subject to
x
∈
X
\begin{array}{ll} \underset{\mathbf{x}}{\operatorname{maximize}} & \sum_{m=1}^{M} \frac{A_{m}(\mathbf{x})}{B_{m}(\mathbf{x})} \\ \text { subject to } & \mathbf{x} \in \mathcal{X} \end{array}
xmaximize subject to ∑m=1MBm(x)Am(x)x∈X
注:此时如果强行直接将Dinkelbach’s Transform应用到多比问题,对于原始多比问题是不能够保证等价性的。
应用理论1可以将单比问题很容易的推广到多比问题,并且由于C3的性质可以很好地保证等价性
- 推论1:
sum-of-ratios问题等价于:
maximize
x
,
y
∑
m
=
1
M
(
2
y
m
A
m
(
x
)
−
y
m
2
B
m
(
x
)
)
subject to
x
∈
X
,
y
m
∈
R
\begin{array}{ll} \underset{\mathbf{x}, \mathbf{y}}{\operatorname{maximize}} & \sum_{m=1}^{M}\left(2 y_{m} \sqrt{A_{m}(\mathbf{x})}-y_{m}^{2} B_{m}(\mathbf{x})\right) \\ \text { subject to } & \mathbf{x} \in \mathcal{X}, y_{m} \in \mathbb{R} \end{array}
x,ymaximize subject to ∑m=1M(2ymAm(x)−ym2Bm(x))x∈X,ym∈R
y \mathbf{y} y表示变量 { y 1 , … , y M } \left\{y_{1}, \ldots, y_{M}\right\} {y1,…,yM}的集合。
推广为更一般的sum-of-ratios问题和max-min-ratio问题,具体如下:
- 推论2:
给定一个非递减函数,以及一系列的
A
m
/
B
m
A_{m} / B_{m}
Am/Bm(
m
=
1
,
.
.
.
,
M
m=1,...,M
m=1,...,M),sum-of-functions-of-ratio问题可以表示为:
maximize
x
∑
m
=
1
M
f
m
(
A
m
(
x
)
B
m
(
x
)
)
subject to
x
∈
X
\begin{aligned} &\operatorname{maximize}_{\mathbf{x}} \sum_{m=1}^{M} f_{m}\left(\frac{A_{m}(\mathbf{x})}{B_{m}(\mathbf{x})}\right)\\ &\text { subject to } \quad x \in \mathcal{X} \end{aligned}
maximizexm=1∑Mfm(Bm(x)Am(x)) subject to x∈X
其等价为:
maximize
x
,
y
∑
m
=
1
M
f
m
(
2
y
m
A
m
(
x
)
−
y
m
2
B
m
(
x
)
)
subject to
x
∈
X
,
y
m
∈
R
,
m
=
1
,
…
,
M
\begin{array}{ll} \underset{\mathbf{x}, \mathbf{y}}{\operatorname{maximize}} & \sum_{m=1}^{M} f_{m}\left(2 y_{m} \sqrt{A_{m}(\mathbf{x})}-y_{m}^{2} B_{m}(\mathbf{x})\right) \\ \text { subject to } & \mathbf{x} \in \mathcal{X}, y_{m} \in \mathbb{R}, m=1, \ldots, M \end{array}
x,ymaximize subject to ∑m=1Mfm(2ymAm(x)−ym2Bm(x))x∈X,ym∈R,m=1,…,M
- 推论3:
给定一系列的 A m / B m A_{m} / B_{m} Am/Bm( m = 1 , . . . , M m=1,...,M m=1,...,M),max-min-ratio问题可以表示为:
maximize x min m { A m ( x ) B m ( x ) } subject to x ∈ X \begin{array}{ll} \underset{\mathbf{x}}{\operatorname{maximize}} & \min _{m}\left\{\frac{A_{m}(\mathbf{x})}{B_{m}(\mathbf{x})}\right\} \\ \text { subject to } & \mathbf{x} \in \mathcal{X} \end{array} xmaximize subject to minm{Bm(x)Am(x)}x∈X
其等价为:
maximize x , y , z z subject to x ∈ X , y m ∈ R , z ∈ R 2 y m A m ( x ) − y m 2 B m ( x ) ≥ z , ∀ m \begin{array}{ll} \underset{\mathrm{x}, \mathrm{y}, z}{\operatorname{maximize}} & z \\ \text { subject to } & \mathrm{x} \in \mathcal{X}, y_{m} \in \mathbb{R}, z \in \mathbb{R} \\ & 2 y_{m} \sqrt{A_{m}(\mathrm{x})}-y_{m}^{2} B_{m}(\mathrm{x}) \geq z, \forall m \end{array} x,y,zmaximize subject to zx∈X,ym∈R,z∈R2ymAm(x)−ym2Bm(x)≥z,∀m
证明思路:首先将原问题写为最大化 z z z约束条件为: x ∈ X x \in \mathcal{X} x∈X和 z ≤ A m ( x ) / B m ( x ) z \leq A_{m}(\mathbf{x}) / B_{m}(\mathbf{x}) z≤Am(x)/Bm(x)。根据C3,最后一个约束条件可以写为: z ≤ max y m ( 2 y m A m ( x ) − y m 2 B m ( x ) ) z \leq \max _{y_{m}}\left(2 y_{m} \sqrt{A_{m}(\mathbf{x})}-y_{m}^{2} B_{m}(\mathbf{x})\right) z≤maxym(2ymAm(x)−ym2Bm(x)),由于这个新的约束是一个less-than-max不等式,那么 max y m \max _{y_{m}} maxym可以退化为 max x , y \max _{\mathbf{x}, \mathbf{y}} maxx,y
C3在等价问题转化中扮演了一个重要的角色!
理论2(多维Quadratic Transform)
进一步考虑分子为向量,分母为矩阵的多维复数情况下的FP。这类FP是在处理多天线通信系统时产生的。考虑一系列函数:
a
m
(
x
)
:
C
d
1
→
C
d
2
\mathbf{a}_{m}(\mathbf{x}): \mathbb{C}^{d_{1}} \rightarrow \mathbb{C}^{d_{2}}
am(x):Cd1→Cd2和
B
m
(
x
)
:
C
d
1
→
S
+
+
d
2
×
d
2
\mathbf{B}_{m}(\mathbf{x}): \mathbb{C}^{d_{1}} \rightarrow \mathbf{S}_{++}^{d_{2} \times d_{2}}
Bm(x):Cd1→S++d2×d2(
m
=
1
,
.
.
.
,
M
m=1,...,M
m=1,...,M),约束集为:
X
⊆
C
d
1
\mathcal{X} \subseteq \mathbb{C}^{d_{1}}
X⊆Cd1且
d
1
,
d
2
∈
N
d_{1}, d_{2} \in \mathbb{N}
d1,d2∈N,多维单比FP问题定义为:
maximize
x
∑
m
=
1
M
a
m
†
(
x
)
B
m
−
1
(
x
)
a
m
(
x
)
subject to
x
∈
X
\begin{aligned} &\underset{\mathbf{x}}{\operatorname{maximize}} \sum_{m=1}^{M} \mathbf{a}_{m}^{\dagger}(\mathbf{x}) \mathbf{B}_{m}^{-1}(\mathbf{x}) \mathbf{a}_{m}(\mathbf{x})\\ &\text { subject to } \quad x \in \mathcal{X} \end{aligned}
xmaximizem=1∑Mam†(x)Bm−1(x)am(x) subject to x∈X
该问题等价为:
maximize
x
,
y
∑
m
=
1
M
(
2
Re
{
y
m
†
a
m
(
x
)
}
−
y
m
†
B
m
(
x
)
y
m
)
subject to
x
∈
X
,
y
m
∈
C
d
2
\begin{array}{ll} \underset{\mathbf{x}, \mathbf{y}}{\operatorname{maximize}} & \sum_{m=1}^{M}\left(2 \operatorname{Re}\left\{\mathbf{y}_{m}^{\dagger} \mathbf{a}_{m}(\mathbf{x})\right\}-\mathbf{y}_{m}^{\dagger} \mathbf{B}_{m}(\mathbf{x}) \mathbf{y}_{m}\right) \\ \text { subject to } & \mathbf{x} \in \mathcal{X}, \mathbf{y}_{m} \in \mathbb{C}^{d_{2}} \end{array}
x,ymaximize subject to ∑m=1M(2Re{ym†am(x)}−ym†Bm(x)ym)x∈X,ym∈Cd2
y
\mathbf{y}
y表示变量
{
y
1
,
…
,
y
M
}
\left\{y_{1}, \ldots, y_{M}\right\}
{y1,…,yM}的集合。
简单的证明思路:将新的等价问题重新表示为 y m † a m + a m † y m − y m † B m y m \mathbf{y}_{m}^{\dagger} \mathbf{a}_{m}+\mathbf{a}_{m}^{\dagger} \mathbf{y}_{m}-\mathbf{y}_{m}^{\dagger} \mathbf{B}_{m} \mathbf{y}_{m} ym†am+am†ym−ym†Bmym,进一步可以写为: a m † B m − 1 a m − ( y m † − a m † B m − 1 ) B m ( y m − B m − 1 a m ) {\mathbf{a}}_m^\dag {\mathbf{B}}_m^{ - 1}{{\mathbf{a}}_m} - \left( {{\mathbf{y}}_m^\dag - {\mathbf{a}}_m^\dag {\mathbf{B}}_m^{ - 1}} \right){{\mathbf{B}}_m}\left( {{{\mathbf{y}}_m} - {\mathbf{B}}_m^{ - 1}{{\mathbf{a}}_m}} \right) am†Bm−1am−(ym†−am†Bm−1)Bm(ym−Bm−1am)(原文有笔误!),可以很容易的看出其最优解为 y m 1 ⋆ = B m − 1 ( x ) a m ( x ) \mathbf{y}_{m_{1}}^{\star}=\mathbf{B}_{m}^{-1}(\mathbf{x}) \mathbf{a}_{m}(\mathbf{x}) ym1⋆=Bm−1(x)am(x),此时其最优值恰好就是 a m † B m − 1 a m \mathbf{a}_{m}^{\dagger} \mathbf{B}_{m}^{-1} \mathbf{a}_{m} am†Bm−1am,因此等价性被建立。
对于Concave-Convex FP问题的迭代优化:
之前讨论是假设分子非负,分母为正,现在讨论特殊类型的Concave-Convex FP问题,其在通信系统设计中尤为重要。
满足Concave-Convex FP问题需要如下条件:
- 分母 A m ( x ) A_{m}(\mathrm{x}) Am(x)均为凹函数
- 分子 B m ( x ) B_{m}(\mathrm{x}) Bm(x)均为凸函数
- 约束集 X \mathcal{X} X是由有限个不等式约束表示的标准形式的非空凸集
对于single-ratio concave-convex FP问题,前面的几种转化都可以很好地解决。现在主要关注multiple-ratio concaveconvex FP 问题。为了说明问题,以标量形式为例,同样可以更根据理论2很容易地拓展到多维形式。
考虑sum-of-ratios、sum-of-functions-of-ratio、max-min-ratio问题。同时假设,每个 A m ( x ) A_{m}(\mathrm{x}) Am(x)是凹的,每个 B m ( x ) B_{m}(\mathrm{x}) Bm(x)是凸的, X \mathcal{X} X是具有标准形式的凸集。假设函数 f m ( ⋅ ) f_{m}(\cdot) fm(⋅)是非递减的。应用二次转换,交替迭代优化原始变量 B m ( x ) B_{m}(\mathrm{x}) Bm(x)和辅助变量 y m y_{m} ym。
当
x
\mathrm{x}
x固定时,最优
y
m
y_{m}
ym存在闭式解:
y
m
⋆
=
A
m
(
x
)
B
m
(
x
)
,
∀
m
=
1
,
…
,
M
y_{m}^{\star}=\frac{\sqrt{A_{m}(\mathrm{x})}}{B_{m}(\mathrm{x})}, \forall m=1, \ldots, M
ym⋆=Bm(x)Am(x),∀m=1,…,M
当
y
m
y_{m}
ym固定时,由于每个
A
m
(
x
)
A_{m}(\mathrm{x})
Am(x)的凹性,每个
B
m
(
x
)
B_{m}(\mathrm{x})
Bm(x)的凸性,以及平方根函数是凹的并且是递增的,二次变化函数:
g
(
x
,
y
m
)
=
2
y
m
A
m
(
x
)
−
y
m
2
B
m
(
x
)
g\left(\mathrm{x}, y_{m}\right)=2 y_{m} \sqrt{A_{m}(\mathrm{x})}-y_{m}^{2} B_{m}(\mathrm{x})
g(x,ym)=2ymAm(x)−ym2Bm(x)
对于固定
y
m
y_{m}
ym时的
x
\mathrm{x}
x是凸的。进一步,由于
f
m
(
⋅
)
f_{m}(\cdot)
fm(⋅)是凸的且非递减,因此
f
m
(
g
(
x
,
y
m
)
)
f_{m}\left(g\left(\mathbf{x}, y_{m}\right)\right)
fm(g(x,ym))对于
x
\mathrm{x}
x是凸的。因此,通过数值凸优化可以有效地得到最优
x
\mathrm{x}
x。
整个算法总结为:
算法1是能够保证concave-convex FP收敛到一个驻点的。
理论3:收敛性证明(驻点)
对于concave-convex sum-of-functions-of-ratio问题,即:每个 A m ( x ) A_{m}(\mathrm{x}) Am(x)是凹的,每个 B m ( x ) B_{m}(\mathrm{x}) Bm(x)是凸的, X \mathcal{X} X是具有标准形式的凸集,函数 f m ( ⋅ ) f_{m}(\cdot) fm(⋅)是非递减的凸函数。算法1包含了一些列的凸优化问题,其可以收敛到原始sum-of-functions-of-ratio问题的一个驻点,且每次迭代的都是非减的。
证明:算法1本质上是重新表述问题的块坐标上升算法(block coordinate ascent algorithm),因此其可以收敛到二次转换后的函数的一个驻点。由于解的等价性(C2)和目标函数值的等价性(C3),在最优 y ⋆ \mathbf{y}^{\star} y⋆下,二次问题和原始的问题是等价的。因此,算法能够收敛到原始问题的一个驻点,而C3则又保证了sum-of-functions-of-ratio 的值是非递减的。
文中证明了:关于可微 A ( x ) , B ( x ) A(\mathbf{x}), B(\mathbf{x}) A(x),B(x)的单比问题和max-min-ratio concave-convex FP问题,算法1是可以收敛到一个全局最优。
- 关于收敛速度
文中给了一个具体的单比问题,
maximize
x
x
x
2
+
1
subject to
x
≥
0
\begin{array}{cl} \underset{x}{\operatorname{maximize}} & \frac{x}{x^{2}+1} \\ \text { subject to } & x \geq 0 \end{array}
xmaximize subject to x2+1xx≥0
收敛速度,以
lim
t
→
∞
∣
y
⋆
−
y
t
+
1
∣
∣
y
⋆
−
y
t
∣
\lim _{t \rightarrow \infty} \frac{\left|y^{\star}-y_{t+1}\right|}{\left|y^{\star}-y_{t}\right|}
limt→∞∣y⋆−yt∣∣y⋆−yt+1∣进行衡量。
对于该例子,最后计算发现算法1的收敛速度是慢于Dinkelbach’s transform的。
虽然传统的Dinkelbach变换比二次变换具有更快的收敛速度,但前者的应用仅限于单比问题,而后者可以处理多比问题。
金句:
For multiple-ratio FP problems where global convergence is not guaranteed, slower convergence can sometime be advantageous as it allows the algorithm to more fully explore the solution space.
功率控制问题:
考虑一个带有一组单天线基站(BSs) B \mathcal{B} B的下行SISO蜂窝网络。具体参数:
- h i , j ∈ C h_{i, j} \in \mathbb{C} hi,j∈C:第 j j j个BS到第 i i i个用户的下行信道
- σ 2 \sigma^{2} σ2:高斯白噪声
- p i p_{i} pi:第 i i i个BS的发射功率水平,受限于 P max P_{\max } Pmax。
则,第
i
i
i用户的下行速率可以表示为:
R
i
=
log
(
1
+
∣
h
i
,
i
∣
2
p
i
∑
j
≠
i
∣
h
i
,
j
∣
2
p
j
+
σ
2
)
R_{i}=\log \left(1+\frac{\left|h_{i, i}\right|^{2} p_{i}}{\sum_{j \neq i}\left|h_{i, j}\right|^{2} p_{j}+\sigma^{2}}\right)
Ri=log(1+∑j=i∣hi,j∣2pj+σ2∣hi,i∣2pi)
考虑weighted sum rate:
f
o
(
p
)
=
∑
i
∈
B
w
i
R
i
f_{o}(\mathbf{p})=\sum_{i \in \mathcal{B}} w_{i} R_{i}
fo(p)=i∈B∑wiRi
其中
w
i
w_{i}
wi代表第
i
i
i个BS-user下行链路的优先权,
p
\mathbf{p}
p表示集合
{
p
i
}
i
∈
B
\left\{p_{i}\right\}_{i \in \mathcal{B}}
{pi}i∈B。整个功率控制问题可以表示为:
maximize
p
f
o
(
p
)
subject to
0
≤
p
i
≤
P
max
,
∀
i
∈
B
,
(
30
)
\begin{array}{ll} \underset{\mathbf{p}}{\operatorname{maximize}} & f_{o}(\mathbf{p}) \\ \text { subject to } & 0 \leq p_{i} \leq P_{\max }, \forall i \in \mathcal{B},\quad(30) \end{array}
pmaximize subject to fo(p)0≤pi≤Pmax,∀i∈B,(30)
住:该问题非凸十分难以结局,可以使用用多块近似方法得到全局解,但不是多项式时间。此外,当所有的SINR都足够高,使得 log ( 1 + SINR ) \log (1+\operatorname{SINR}) log(1+SINR)可以近似为 log ( SINR ) \log (\operatorname{SINR}) log(SINR)时,该问题可以通过几何规划来全局求解。本文的目的是用一种有效的方法找到至少一个驻点。
直接FP方法(Direct FP Approach)
log函数是非凸的且不减的,利用二次转换,其可以表示为如下的问题:
maximize
p
,
y
f
q
D
I
R
(
p
,
y
)
subject to
0
≤
p
i
≤
P
max
,
∀
i
∈
B
y
i
∈
R
,
∀
i
∈
B
\begin{array}{ll} \underset{\mathbf{p}, \mathbf{y}}{\operatorname{maximize}} & f_{q}^{\mathrm{DIR}}(\mathbf{p}, \mathbf{y}) \\ \text { subject to } & 0 \leq p_{i} \leq P_{\max }, \forall i \in \mathcal{B} \\ & y_{i} \in \mathbb{R}, \forall i \in \mathcal{B} \end{array}
p,ymaximize subject to fqDIR(p,y)0≤pi≤Pmax,∀i∈Byi∈R,∀i∈B
其中:
f
q
D
I
R
(
x
,
y
)
=
∑
i
∈
B
w
i
log
(
1
+
2
y
i
∣
h
i
,
i
∣
2
p
i
−
y
i
2
(
∑
j
≠
i
∣
h
i
,
j
∣
2
p
j
+
σ
2
)
)
f_{q}^{\mathrm{DIR}}(\mathbf{x}, \mathbf{y})=\sum_{i \in \mathcal{B}} w_{i} \log \left(1+2 y_{i} \sqrt{\left|h_{i, i}\right|^{2} p_{i}}\right.\left.-y_{i}^{2}\left(\sum_{j \neq i}\left|h_{i, j}\right|^{2} p_{j}+\sigma^{2}\right)\right)
fqDIR(x,y)=i∈B∑wilog(1+2yi∣hi,i∣2pi−yi2⎝⎛j=i∑∣hi,j∣2pj+σ2⎠⎞⎠⎞
y
i
y_{i}
yi是由每个下行链路
i
i
i的二次变换引入的。
根据算法1,交替优化
y
i
y_{i}
yi和
p
i
p_{i}
pi。对于固定的
p
i
p_{i}
pi,最优
y
i
y_{i}
yi表示为:
y
i
⋆
=
∣
h
i
,
i
∣
2
p
i
∑
j
≠
i
∣
h
i
,
j
∣
2
p
j
+
σ
2
y_{i}^{\star}=\frac{\sqrt{\left|h_{i, i}\right|^{2} p_{i}}}{\sum_{j \neq i}\left|h_{i, j}\right|^{2} p_{j}+\sigma^{2}}
yi⋆=∑j=i∣hi,j∣2pj+σ2∣hi,i∣2pi
然后,固定 y i y_{i} yi寻找最优的 p i p_{i} pi是一个凸问题,整个功率控制方法可以被总结为算法2。
根据理论3,算法2是可以保证收敛到一个驻点的。
算法2可以很容易的延伸到多波段系统,频段被分为
T
T
T个子频段,用户速率可以被计算为:
R
i
=
∑
t
=
1
T
1
T
log
(
1
+
∣
h
i
,
i
t
∣
2
p
i
t
∑
j
≠
i
∣
h
i
,
j
t
∣
2
p
j
t
+
σ
2
)
R_{i}=\sum_{t=1}^{T} \frac{1}{T} \log \left(1+\frac{\left|h_{i, i}^{t}\right|^{2} p_{i}^{t}}{\sum_{j \neq i}\left|h_{i, j}^{t}\right|^{2} p_{j}^{t}+\sigma^{2}}\right)
Ri=t=1∑TT1log(1+∑j=i∣∣hi,jt∣∣2pjt+σ2∣∣hi,it∣∣2pit)
h
i
,
j
t
h_{i, j}^{t}
hi,jt和
p
j
t
p_{j}^{t}
pjt分别代表第
t
t
t个子频段的信道和传输功率水平。整个功率约束表示为:
∑
t
=
1
T
p
i
t
≤
P
max
,
∀
i
∈
B
,
p
i
t
≥
0
,
∀
i
∈
B
,
t
=
1
,
…
,
T
\sum_{t=1}^{T} p_{i}^{t} \leq P_{\max }, \forall i \in \mathcal{B}, \quad p_{i}^{t} \geq 0, \forall i \in \mathcal{B}, t=1, \ldots, T
t=1∑Tpit≤Pmax,∀i∈B,pit≥0,∀i∈B,t=1,…,T
要修改算法2以在这个多波段场景中工作:步骤1保持不变;步骤2通过解决凸问题更新
p
p
p。
功率控制的直接FP方法可以适应无线网络中一般速率效用函数的最大化。
- 一般效用最大化
给定每个用户 i i i速率 R i R_{i} Ri的一个不减的凹效用函数 U i U_{i} Ui,总效用最大化问题表示为:
maximize p ∑ i ∈ B U i ( R i ) subject to 0 ≤ p i ≤ P max , ∀ i ∈ B \begin{array}{ll} \underset{\mathbf{p}}{\operatorname{maximize}} & \sum_{i \in \mathcal{B}} U_{i}\left(R_{i}\right) \\ \text { subject to } & 0 \leq p_{i} \leq P_{\max }, \forall i \in \mathcal{B} \end{array} pmaximize subject to ∑i∈BUi(Ri)0≤pi≤Pmax,∀i∈B
其等价为:
maximize p , y ∑ i ∈ B U i ( Q i ) subject to 0 ≤ p i ≤ P max , ∀ i ∈ B y i ∈ R , ∀ i ∈ R \begin{array}{ll} \underset{\mathbf{p}, \mathbf{y}}{\operatorname{maximize}} & \sum_{i \in \mathcal{B}} U_{i}\left(Q_{i}\right) \\ \text { subject to } & 0 \leq p_{i} \leq P_{\max }, \forall i \in \mathcal{B} \\ & y_{i} \in \mathbb{R}, \forall i \in \mathbb{R} \end{array} p,ymaximize subject to ∑i∈BUi(Qi)0≤pi≤Pmax,∀i∈Byi∈R,∀i∈R
其中: Q i = log ( 1 + 2 y i ∣ h i , i ∣ p i − y i 2 ∑ j ≠ i ∣ h i , j ∣ 2 p j − y i 2 σ 2 ) Q_{i}=\log \left(1+2 y_{i}\left|h_{i, i}\right| \sqrt{p_{i}}-y_{i}^{2} \sum_{j \neq i}\left|h_{i, j}\right|^{2} p_{j}-y_{i}^{2} \sigma^{2}\right) Qi=log(1+2yi∣hi,i∣pi−yi2∑j=i∣hi,j∣2pj−yi2σ2)
进一步的,直接FP方法可以被用于解决最大化最小速率问题
闭式FP方法(Closed-Form FP Approach)
闭式FP的方法是基于拉格朗日对偶重塑问题。这将导致重构的新问题在每次迭代中均是以闭式解执行,而不是用数值方法解决一个凸优化问题。原始的功率问题通过拉格朗日对偶可以等价为:
maximize
x
,
γ
f
r
C
F
(
x
,
γ
)
subject to
x
∈
X
\begin{array}{ll} \underset{\mathbf{x},\mathbf{\gamma}}{\operatorname{maximize}} & f_{r}^{\mathrm{CF}}(\mathbf{x}, \gamma) \\ \text { subject to } & \mathbf{x} \in \mathcal{X} \end{array}
x,γmaximize subject to frCF(x,γ)x∈X
其中
γ
\mathbf{\gamma}
γ是一系列辅助变量
{
γ
i
}
i
∈
B
\left\{\gamma_{i}\right\}_{i \in \mathcal{B}}
{γi}i∈B的集合,新的目标函数为:
f
r
C
F
(
p
,
γ
)
=
∑
i
∈
B
w
i
log
(
1
+
γ
i
)
−
∑
i
∈
B
w
i
γ
i
+
∑
i
∈
B
w
i
(
1
+
γ
i
)
∣
h
i
,
i
∣
2
p
i
∑
j
∈
B
∣
h
i
,
j
∣
2
p
j
+
σ
2
f_{r}^{\mathrm{CF}}(\mathbf{p}, \gamma)=\sum_{i \in \mathcal{B}} w_{i} \log \left(1+\gamma_{i}\right)-\sum_{i \in \mathcal{B}} w_{i} \gamma_{i} +\sum_{i \in \mathcal{B}} \frac{w_{i}\left(1+\gamma_{i}\right)\left|h_{i, i}\right|^{2} p_{i}}{\sum_{j \in \mathcal{B}}\left|h_{i, j}\right|^{2} p_{j}+\sigma^{2}}
frCF(p,γ)=i∈B∑wilog(1+γi)−i∈B∑wiγi+i∈B∑∑j∈B∣hi,j∣2pj+σ2wi(1+γi)∣hi,i∣2pi
当
p
i
p_i
pi固定时,最优
γ
i
\gamma_{i}
γi通过
∂
f
r
C
F
/
∂
γ
i
\partial f_{r}^{\mathrm{CF}} / \partial \gamma_{i}
∂frCF/∂γi置0得到,有:
γ
i
⋆
=
∣
h
i
,
i
∣
2
p
i
∑
j
≠
i
∣
h
i
,
j
∣
2
p
j
+
σ
2
,
∀
i
∈
B
,
(
42
)
\gamma_{i}^{\star}=\frac{\left|h_{i, i}\right|^{2} p_{i}}{\sum_{j \neq i}\left|h_{i, j}\right|^{2} p_{j}+\sigma^{2}}, \forall i \in \mathcal{B},\quad(42)
γi⋆=∑j=i∣hi,j∣2pj+σ2∣hi,i∣2pi,∀i∈B,(42)
可以看出,最优的
γ
i
\gamma_{i}
γi等价于BS
i
i
i的下行SINR。当
γ
i
\gamma_{i}
γi固定时,
f
r
C
F
f_{r}^{\mathrm{CF}}
frCF的最后一项,是一个sum-of-ratio项,其包含了
p
i
p_i
pi的优化。利用二次转换,
f
r
C
F
f_{r}^{\mathrm{CF}}
frCF可以重铸为:
f
q
C
F
(
p
,
γ
,
y
)
=
∑
i
∈
B
2
y
i
w
i
(
1
+
γ
i
)
∣
h
i
,
i
∣
2
p
i
−
∑
i
∈
B
y
i
2
(
∑
j
∈
B
∣
h
i
,
j
∣
2
p
j
+
σ
2
)
+
const
(
γ
)
f_{q}^{\mathrm{CF}}(\mathbf{p}, \gamma, \mathbf{y}) =\sum_{i \in \mathcal{B}} 2 y_{i} \sqrt{w_{i}\left(1+\gamma_{i}\right)\left|h_{i, i}\right|^{2} p_{i}} - \sum_{i \in \mathcal{B}} y_{i}^{2}\left(\sum_{j \in \mathcal{B}}\left|h_{i, j}\right|^{2} p_{j}+\sigma^{2}\right)+\operatorname{const}(\gamma)
fqCF(p,γ,y)=i∈B∑2yiwi(1+γi)∣hi,i∣2pi−i∈B∑yi2⎝⎛j∈B∑∣hi,j∣2pj+σ2⎠⎞+const(γ)
其中,
y
\mathbf{y}
y表示集合
{
y
i
}
i
∈
B
\left\{y_{i}\right\}_{i \in \mathcal{B}}
{yi}i∈B,
const
(
γ
)
\operatorname{const}(\gamma)
const(γ)表示当
γ
\mathbf{\gamma}
γ时的一些常数项。而
p
i
p_i
pi和
y
i
y_i
yi关于最大化
f
q
C
F
f_{q}^{\mathrm{CF}}
fqCF,均存在闭式解为:
p
i
⋆
=
min
{
P
max
,
y
i
2
w
i
(
1
+
γ
i
)
∣
h
i
,
i
∣
2
(
∑
j
∈
B
y
j
2
∣
h
j
,
i
∣
2
)
2
}
,
∀
i
∈
B
,
(
44
)
p_{i}^{\star}=\min \left\{P_{\max }, \frac{y_{i}^{2} w_{i}\left(1+\gamma_{i}\right)\left|h_{i, i}\right|^{2}}{\left(\sum_{j \in \mathcal{B}} y_{j}^{2}\left|h_{j, i}\right|^{2}\right)^{2}}\right\}, \forall i \in \mathcal{B},\quad(44)
pi⋆=min⎩⎪⎨⎪⎧Pmax,(∑j∈Byj2∣hj,i∣2)2yi2wi(1+γi)∣hi,i∣2⎭⎪⎬⎪⎫,∀i∈B,(44)
y i ⋆ = w i ( 1 + γ i ) ∣ h i , i ∣ 2 p i ∑ j ∈ B ∣ h i , j ∣ 2 p j + σ 2 , ∀ i ∈ B , , ( 45 ) y_{i}^{\star}=\frac{\sqrt{w_{i}\left(1+\gamma_{i}\right)\left|h_{i, i}\right|^{2} p_{i}}}{\sum_{j \in \mathcal{B}}\left|h_{i, j}\right|^{2} p_{j}+\sigma^{2}}, \forall i \in \mathcal{B},,\quad(45) yi⋆=∑j∈B∣hi,j∣2pj+σ2wi(1+γi)∣hi,i∣2pi,∀i∈B,,(45)
整个交替迭代更新的步骤可以总结为步骤3。
- 注:不像直接FP方法,整个闭式FP算法并不是传统的块坐标上升,因为优化的目标函数并不是固定的。例如: γ i \gamma_i γi是针对于 f r C F f_{r}^{\mathrm{CF}} frCF优化更新,而 y i y_i yi和 p i p_i pi是针对 f q C F f_{q}^{\mathrm{CF}} fqCF优化更新,但是,它依然可以保证收敛到一个驻点。
与固定点迭代的关系
算法3可以解释为一阶条件下的不动点迭代。获得功率控制问题的不动点解等价于找到(30)的一阶条件的解,即:
∂
f
o
(
p
)
∂
p
i
=
0
,
∀
i
∈
B
,
(
46
)
\frac{\partial f_{o}(\mathbf{p})}{\partial p_{i}}=0, \forall i \in \mathcal{B},\quad (46)
∂pi∂fo(p)=0,∀i∈B,(46)
其具体表示为:
1
p
i
⋅
w
i
γ
i
(
p
)
1
+
γ
i
(
p
)
⏟
T
1
i
(
p
)
−
∑
j
≠
i
w
j
γ
i
2
(
p
)
∣
h
j
,
i
∣
2
(
1
+
γ
i
(
p
)
)
∣
h
j
,
j
∣
2
p
j
⏟
T
2
i
(
p
)
=
0
,
(
47
,
作
者
存
在
笔
误
)
\frac{1}{p_{i}} \cdot \underbrace{\frac{w_{i} \gamma_{i}(\mathbf{p})}{1+\gamma_{i}(\mathbf{p})}}_{T_{1 i}(\mathbf{p})}-\underbrace{\sum_{j \neq i} \frac{w_{j} \gamma_{i}^{2}(\mathbf{p})\left|h_{j, i}\right|^{2}}{\left(1+\gamma_{i}(\mathbf{p})\right)\left|h_{j, j}\right|^{2} p_{j}}}_{T_{2 i}(\mathbf{p})}=0,\quad (47,作者存在笔误)
pi1⋅T1i(p)
1+γi(p)wiγi(p)−T2i(p)
j=i∑(1+γi(p))∣hj,j∣2pjwjγi2(p)∣hj,i∣2=0,(47,作者存在笔误)
- 具体推导(注:
γ
i
(
p
)
=
∣
h
i
,
i
∣
2
p
i
∑
j
≠
i
∣
h
i
,
j
∣
2
p
j
+
σ
2
{\gamma _i}({\mathbf{p}})=\frac{\left|h_{i, i}\right|^{2} p_{i}}{\sum_{j \neq i}\left|h_{i, j}\right|^{2} p_{j}+\sigma^{2}}
γi(p)=∑j=i∣hi,j∣2pj+σ2∣hi,i∣2pi):
f o ( p ) = ∑ i w i log ( 1 + ∣ h i , i ∣ 2 p i ∑ j ≠ i ∣ h i , j ∣ 2 p j + σ 2 ) = w i log ( 1 + ∣ h i , i ∣ 2 p i ∑ j ≠ i ∣ h i , j ∣ 2 p j + σ 2 ) ⏟ f o 1 + ∑ j ≠ i w j log ( 1 + ∣ h j , j ∣ 2 p j ∑ l ≠ j ∣ h j , l ∣ 2 p l + σ 2 ) ⏟ f o 2 {f_o}({\mathbf{p}}) = \sum\limits_i {{w_i}\log \left( {1 + \frac{{{{\left| {{h_{i,i}}} \right|}^2}{p_i}}}{{\sum\limits_{j \ne i} {{{\left| {{h_{i,j}}} \right|}^2}} {p_j} + {\sigma ^2}}}} \right)} = \underbrace {{w_i}\log \left( {1 + \frac{{{{\left| {{h_{i,i}}} \right|}^2}{p_i}}}{{\sum\limits_{j \ne i} {{{\left| {{h_{i,j}}} \right|}^2}} {p_j} + {\sigma ^2}}}} \right)}_{{f_{o1}}} + \underbrace {\sum\limits_{j \ne i} {{w_j}\log \left( {1 + \frac{{{{\left| {{h_{j,j}}} \right|}^2}{p_j}}}{{\sum\limits_{l \ne j} {{{\left| {{h_{j,l}}} \right|}^2}} {p_l} + {\sigma ^2}}}} \right)} }_{{f_{o2}}} fo(p)=i∑wilog⎝⎜⎛1+j=i∑∣hi,j∣2pj+σ2∣hi,i∣2pi⎠⎟⎞=fo1 wilog⎝⎜⎛1+j=i∑∣hi,j∣2pj+σ2∣hi,i∣2pi⎠⎟⎞+fo2 j=i∑wjlog⎝⎜⎛1+l=j∑∣hj,l∣2pl+σ2∣hj,j∣2pj⎠⎟⎞
∂ f o 1 ∂ p i = w i 1 + ∣ h i , i ∣ 2 p i ∑ j ≠ i ∣ h i , j ∣ 2 p j + σ 2 ⋅ ∣ h i , i ∣ 2 ∑ j ≠ i ∣ h i , j ∣ 2 p j + σ 2 = 1 p i w i γ i ( p ) 1 + γ i ( p ) \frac{{\partial {f_{o1}}}}{{\partial {p_i}}} = \frac{{{w_i}}}{{1 + \frac{{{{\left| {{h_{i,i}}} \right|}^2}{p_i}}}{{\sum\limits_{j \ne i} {{{\left| {{h_{i,j}}} \right|}^2}} {p_j} + {\sigma ^2}}}}} \cdot \frac{{{{\left| {{h_{i,i}}} \right|}^2}}}{{\sum\limits_{j \ne i} {{{\left| {{h_{i,j}}} \right|}^2}} {p_j} + {\sigma ^2}}} = \frac{1}{{{p_i}}}\frac{{{w_i}{\gamma _i}({\mathbf{p}})}}{{1 + {\gamma _i}({\mathbf{p}})}} ∂pi∂fo1=1+j=i∑∣hi,j∣2pj+σ2∣hi,i∣2piwi⋅j=i∑∣hi,j∣2pj+σ2∣hi,i∣2=pi11+γi(p)wiγi(p)
∂ f o 2 ∂ p i = − ∑ j ≠ i w j 1 + ∣ h j , j ∣ 2 p j ∑ l ≠ j ∣ h j , l ∣ 2 p l + σ 2 ⋅ ∣ h j , j ∣ 2 p j ( ∑ l ≠ j ∣ h j , l ∣ 2 p l + σ 2 ) 2 ⋅ ∣ h j , i ∣ 2 = − ∑ j ≠ i w j γ j 2 ( p ) ∣ h j , i ∣ 2 ( 1 + γ j ( p ) ) ∣ h j , j ∣ 2 p j \frac{{\partial {f_{o2}}}}{{\partial {p_i}}} = - \sum\limits_{j \ne i} {\frac{{{w_j}}}{{1 + \frac{{{{\left| {{h_{j,j}}} \right|}^2}{p_j}}}{{\sum\limits_{l \ne j} {{{\left| {{h_{j,l}}} \right|}^2}} {p_l} + {\sigma ^2}}}}}} \cdot \frac{{{{\left| {{h_{j,j}}} \right|}^2}{p_j}}}{{{{\left( {\sum\limits_{l \ne j} {{{\left| {{h_{j,l}}} \right|}^2}} {p_l} + {\sigma ^2}} \right)}^2}}} \cdot {\left| {{h_{j,i}}} \right|^2} = - \sum\limits_{j \ne i} {\frac{{{w_j}\gamma _j^2({\mathbf{p}}){{\left| {{h_{j,i}}} \right|}^2}}}{{(1 + {\gamma _j}({\mathbf{p}})){{\left| {{h_{j,j}}} \right|}^2}{p_j}}}} ∂pi∂fo2=−j=i∑1+l=j∑∣hj,l∣2pl+σ2∣hj,j∣2pjwj⋅(l=j∑∣hj,l∣2pl+σ2)2∣hj,j∣2pj⋅∣hj,i∣2=−j=i∑(1+γj(p))∣hj,j∣2pjwjγj2(p)∣hj,i∣2
∂ f o ( p ) ∂ p i = ∂ f o 1 ∂ p i + ∂ f o 1 ∂ p i = 1 p i w i γ i ( p ) 1 + γ i ( p ) − ∑ j ≠ i w j γ j 2 ( p ) ∣ h j , i ∣ 2 ( 1 + γ j ( p ) ) ∣ h j , j ∣ 2 p j \frac{{\partial {f_o}({\mathbf{p}})}}{{\partial {p_i}}} = \frac{{\partial {f_{o1}}}}{{\partial {p_i}}} + \frac{{\partial {f_{o1}}}}{{\partial {p_i}}} = \frac{1}{{{p_i}}}\frac{{{w_i}{\gamma _i}({\mathbf{p}})}}{{1 + {\gamma _i}({\mathbf{p}})}} - \sum\limits_{j \ne i} {\frac{{{w_j}\gamma _j^2({\mathbf{p}}){{\left| {{h_{j,i}}} \right|}^2}}}{{(1 + {\gamma _j}({\mathbf{p}})){{\left| {{h_{j,j}}} \right|}^2}{p_j}}}} ∂pi∂fo(p)=∂pi∂fo1+∂pi∂fo1=pi11+γi(p)wiγi(p)−j=i∑(1+γj(p))∣hj,j∣2pjwjγj2(p)∣hj,i∣2
γ i ( p ) {\gamma _i}({\mathbf{p}}) γi(p)表示小区 i i i的关于 p \mathbf{p} p的SINR函数。
为了找到一个满足上述一阶条件条件的功率集合,一个策略是在方程的一边孤立
p
i
p_i
pi,这自动产生一个功率更新方程,如果收敛,将至少实现功率控制问题的一个平稳点。但是,为了保证不动点迭代的收敛性,一般不容易确定(46)左边的哪一部分应该固定,一些文章建议固定
T
1
i
T_{1i}
T1i和
T
2
i
T_{2i}
T2i,并达到如下功率控制的定点方法:
p
i
[
t
+
1
]
=
min
{
P
max
,
T
1
i
(
p
[
t
]
)
T
2
i
(
p
[
t
]
)
}
,
∀
i
∈
B
p_{i}[t+1]=\min \left\{P_{\max }, \frac{T_{1 i}(\mathbf{p}[t])}{T_{2 i}(\mathbf{p}[t])}\right\}, \forall i \in \mathcal{B}
pi[t+1]=min{Pmax,T2i(p[t])T1i(p[t])},∀i∈B
其中index i i i表示迭代次数。然而,这种不动点迭代并不一定收敛。(事实上,有文章证明了当得到的SINR值都足够高时,这种迭代保证收敛。)
对于闭式FP方法,把
γ
⋆
\gamma^{\star}
γ⋆和
y
⋆
\mathrm{y}^{\star}
y⋆带入到(44),更新式子(44)也可以看作是功率控制的第一阶条件的不动点迭代,它和(47)非常相似,如下:
1
p
i
⋅
w
i
γ
i
(
p
)
p
i
⏟
T
~
1
i
(
p
)
−
∑
j
w
j
γ
i
2
(
p
)
∣
h
j
,
i
∣
2
(
1
+
γ
i
(
p
)
)
∣
h
j
,
j
∣
2
p
j
⏟
T
~
2
i
(
p
)
=
0.
\frac{1}{\sqrt{p_{i}}} \cdot \underbrace{\frac{w_{i} \gamma_{i}(\mathbf{p})}{\sqrt{p_{i}}}}_{\widetilde{T}_{1 i}(\mathbf{p})}-\underbrace{\sum_{j} \frac{w_{j} \gamma_{i}^{2}(\mathbf{p})\left|h_{j, i}\right|^{2}}{\left(1+\gamma_{i}(\mathbf{p})\right)\left|h_{j, j}\right|^{2} p_{j}}}_{\tilde{T}_{2 i}(\mathbf{p})}=0 .
pi1⋅T
1i(p)
piwiγi(p)−T~2i(p)
j∑(1+γi(p))∣hj,j∣2pjwjγi2(p)∣hj,i∣2=0.
在这种情况下,发射功率变量
p
i
p_i
pi更新变为:
p
i
[
t
+
1
]
=
min
{
P
max
,
(
T
~
1
i
(
p
[
t
]
)
T
~
2
i
(
p
[
t
]
)
)
2
}
,
∀
i
∈
B
p_{i}[t+1]=\min \left\{P_{\max },\left(\frac{\widetilde{T}_{1 i}(\mathbf{p}[t])}{\widetilde{T}_{2 i}(\mathbf{p}[t])}\right)^{2}\right\}, \forall i \in \mathcal{B}
pi[t+1]=min⎩⎨⎧Pmax,(T
2i(p[t])T
1i(p[t]))2⎭⎬⎫,∀i∈B
再加上一个附加的投影步骤到约束集上,经过一些代数运算,可以看到是(44)。因此,算法3的功率控制部分只是一个不动点迭代,但其具有保证收敛性的关键优势。
仿真结果
图3显示了各种功率控制算法在平坦衰落信道中的性能。闭型FP需要最大的迭代次数来收敛,但是它每次迭代的计算量是最低的,因为每次迭代它有闭式解的形式更新。相比之下,SCALE和直接FP都需要在每次迭代中解决一个凸问题。闭式FP的在迭代的基础上,该方法也比牛顿法的复杂度低。闭式FP最快
图4仿真了频率选择性衰落场景,其中带宽分为4个子频带,每个频带调度一个下行用户。由此产生的功率控制不同于平坦衰落情况,因为子带之间存在功率和约束,即: ∑ n p i n ≤ P max \sum_{n} p_{i}^{n} \leq P_{\max } ∑npin≤Pmax。 p i p_i pi`表示BS i i i在第 n n n个频段的功率水平。
结论:
基于FP的方法在功率控制方面与最先进的算法具有竞争优势。FP由于其较低的迭代成本而具有较低的总体复杂度。需要注意的是,不同算法的收敛值可能会因起始点的不同而不同,因为在所有情况下只保证平稳收敛。
Beamforming问题
考虑多维FP在波束形成优化问题中的应用。考虑下行一组BSs B \mathcal{B} B的MIMO蜂窝网络。具体参数如下:
- M M M:基站天线数目
- N N N:每个用户天线数目
- H i m , j ∈ C N × M \mathbf{H}_{i m, j} \in \mathbb{C}^{N \times M} Him,j∈CN×M:从BS j j j到在BS i i i的第m个数据流中调度的用户的下行链路信道。
- σ 2 \sigma^{2} σ2:加性高斯白噪声功率水平。
- v i m ∈ C M \mathbf{v}_{i m} \in \mathbb{C}^{M} vim∈CM:BS i i i对于它第 m m m个数据流的下行发送波束赋形。
数据流
(
i
,
m
)
(i,m)
(i,m)的速率表示为:
R
i
m
(
V
)
=
log
(
1
+
v
i
m
†
H
i
m
,
i
†
(
σ
2
I
+
∑
(
j
,
n
)
≠
(
i
,
m
)
H
i
m
,
j
v
j
n
v
j
n
†
H
i
m
,
j
†
)
−
1
H
i
m
,
i
v
i
m
)
R_{i m}(\mathbf{V})=\log \left(1+\mathbf{v}_{i m}^{\dagger} \mathbf{H}_{i m, i}^{\dagger}\left(\sigma^{2} \mathbf{I}+\sum_{(j, n) \neq(i, m)} \mathbf{H}_{i m, j} \mathbf{v}_{j n} \mathbf{v}_{j n}^{\dagger} \mathbf{H}_{i m, j}^{\dagger}\right)^{-1} \mathbf{H}_{i m, i} \mathbf{v}_{i m}\right)
Rim(V)=log⎝⎜⎛1+vim†Him,i†⎝⎛σ2I+(j,n)=(i,m)∑Him,jvjnvjn†Him,j†⎠⎞−1Him,ivim⎠⎟⎞
设
w
i
w_i
wi表示表示在BS
i
i
i第
m
m
m个数据流被调度用户的优先级。寻求最大化波束形成矢量的加权和速率问题为:
maximize
V
∑
i
,
m
w
i
m
R
i
m
(
V
)
subject to
∑
m
=
1
M
∥
v
i
m
∥
2
2
≤
P
max
,
∀
i
∈
B
\begin{array}{ll} \underset{\mathbf{V}}{\operatorname{maximize}} & \sum_{i, m} w_{i m} R_{i m}(\mathbf{V}) \\ \text { subject to } & \sum_{m=1}^{M}\left\|\mathbf{v}_{i m}\right\|_{2}^{2} \leq P_{\max }, \forall i \in \mathcal{B} \end{array}
Vmaximize subject to ∑i,mwimRim(V)∑m=1M∥vim∥22≤Pmax,∀i∈B
多维直接FP方法
引用多维二次转换于每个SINR项,新的问题可以表示为:
maximize
V
,
Y
f
q
D
I
R
(
V
,
Y
)
subject to
∑
m
=
1
M
∥
v
i
m
∥
2
2
≤
P
max
,
∀
i
∈
B
y
i
m
∈
C
N
,
(
52
)
\begin{array}{ll} \underset{\mathbf{V}, \mathbf{Y}}{\operatorname{maximize}} & f_{q}^{\mathrm{DIR}}(\mathbf{V}, \mathbf{Y}) \\ \text { subject to } & \sum_{m=1}^{M}\left\|\mathbf{v}_{i m}\right\|_{2}^{2} \leq P_{\max }, \forall i \in \mathcal{B} \\ & \mathbf{y}_{i m} \in \mathbb{C}^{N},\quad(52) \end{array}
V,Ymaximize subject to fqDIR(V,Y)∑m=1M∥vim∥22≤Pmax,∀i∈Byim∈CN,(52)
其中:
f
q
D
I
R
(
V
,
Y
)
=
∑
(
i
,
m
)
w
i
m
log
(
1
+
2
Re
{
y
i
m
†
H
i
m
,
i
v
i
m
}
−
y
i
m
†
(
σ
2
I
+
∑
(
j
,
n
)
≠
(
i
,
m
)
H
i
m
,
j
v
j
n
v
j
n
†
H
i
m
,
j
†
)
y
i
m
)
f_{q}^{\mathrm{DIR}}(\mathbf{V}, \mathbf{Y})=\sum_{(i, m)} w_{i m} \log \left(1+2 \operatorname{Re}\left\{\mathbf{y}_{i m}^{\dagger} \mathbf{H}_{i m, i} \mathbf{v}_{i m}\right\}-\mathbf{y}_{i m}^{\dagger}\left(\sigma^{2} \mathbf{I}+\sum_{(j, n) \neq(i, m)} \mathbf{H}_{i m, j} \mathbf{v}_{j n} \mathbf{v}_{j n}^{\dagger} \mathbf{H}_{i m, j}^{\dagger}\right) \mathbf{y}_{i m}\right)
fqDIR(V,Y)=(i,m)∑wimlog⎝⎛1+2Re{yim†Him,ivim}−yim†⎝⎛σ2I+(j,n)=(i,m)∑Him,jvjnvjn†Him,j†⎠⎞yim⎠⎞
$ \mathbf{Y}
表
示
为
每
个
数
据
流
表示为每个数据流
表示为每个数据流(i,m)
辅
助
变
量
集
合
辅助变量集合
辅助变量集合\left{\mathbf{y}{i m}\right}
(
(
(\mathbf{y}{i m} \in \mathbb{C}^{N}$)。
解耦后的函数对于 v i m \mathbf{v}_{i m} vim是一个凹函数,由于log函数不减凹的函数,新的优化问题对于 y i m \mathbf{y}_{i m} yim固定时的 v i m \mathbf{v}_{i m} vim是一个凸问题。
应用算法1在
y
i
m
\mathbf{y}_{i m}
yim和
v
i
m
\mathbf{v}_{i m}
vim之间交替迭代,当
v
i
m
\mathbf{v}_{i m}
vim固定时最优
y
i
m
\mathbf{y}_{i m}
yim表示为:
y
i
m
⋆
=
(
σ
2
I
+
∑
(
j
,
n
)
≠
(
i
,
m
)
H
i
m
,
j
v
j
n
v
j
n
†
H
i
m
,
j
†
)
−
1
H
i
m
,
i
v
i
m
\mathbf{y}_{i m}^{\star}=\left(\sigma^{2} \mathbf{I}+\sum_{(j, n) \neq(i, m)} \mathbf{H}_{i m, j} \mathbf{v}_{j n} \mathbf{v}_{j n}^{\dagger} \mathbf{H}_{i m, j}^{\dagger}\right)^{-1} \mathbf{H}_{i m, i} \mathbf{v}_{i m}
yim⋆=⎝⎛σ2I+(j,n)=(i,m)∑Him,jvjnvjn†Him,j†⎠⎞−1Him,ivim
对于固定的 y i m \mathbf{y}_{i m} yim,最优 v i m \mathbf{v}_{i m} vim可以通过凸优化得到。整个交替迭代更具理论3是可以收敛到一个驻点的。整个算法4总结如下:
多维闭式FP方法
应用拉格朗日对偶转换,原问题可以表示为
f
r
C
F
(
V
,
γ
)
f_{r}^{\mathrm{CF}}(\mathbf{V}, \mathbf{\gamma})
frCF(V,γ):
f
r
C
F
(
V
,
γ
)
=
∑
(
i
,
m
)
w
i
m
(
log
(
1
+
γ
i
m
)
−
γ
i
m
+
(
1
+
γ
i
m
)
v
i
m
†
H
i
m
,
i
†
(
σ
2
I
+
∑
(
j
,
n
)
H
i
m
,
j
v
j
n
v
j
n
†
H
i
m
,
j
†
)
−
1
H
i
m
,
i
v
i
m
)
f_{r}^{\mathrm{CF}}(\mathbf{V}, \gamma)=\sum_{(i, m)} w_{i m}\left(\log \left(1+\gamma_{i m}\right)-\gamma_{i m}+\left(1+\gamma_{i m}\right) \mathbf{v}_{i m}^{\dagger} \mathbf{H}_{i m, i}^{\dagger}\left(\sigma^{2} \mathbf{I}+\sum_{(j, n)} \mathbf{H}_{i m, j} \mathbf{v}_{j n} \mathbf{v}_{j n}^{\dagger} \mathbf{H}_{i m, j}^{\dagger}\right)^{-1} \mathbf{H}_{i m, i} \mathbf{v}_{i m}\right)
frCF(V,γ)=(i,m)∑wim⎝⎜⎛log(1+γim)−γim+(1+γim)vim†Him,i†⎝⎛σ2I+(j,n)∑Him,jvjnvjn†Him,j†⎠⎞−1Him,ivim⎠⎟⎞
其中
γ
\mathbf{\gamma}
γ为
{
γ
i
m
}
\left\{\gamma_{i m}\right\}
{γim}`集合。
固定
v
i
m
\mathbf{v}_{i m}
vim,最优
γ
\mathbf{\gamma}
γ通过
∂
f
r
C
F
/
∂
γ
i
m
\partial f_{r}^{\mathrm{CF}} / \partial \gamma_{i m}
∂frCF/∂γim求导置0而得,其表示为:
γ
i
m
⋆
=
v
i
m
†
H
i
m
,
i
†
(
σ
2
I
+
∑
(
j
,
n
)
≠
(
i
,
m
)
H
i
m
,
j
v
j
n
v
j
n
†
H
i
m
,
j
†
)
−
1
H
i
m
,
i
v
i
m
\gamma_{i m}^{\star}=\mathbf{v}_{i m}^{\dagger} \mathbf{H}_{i m, i}^{\dagger}\left(\sigma^{2} \mathbf{I}+\sum_{(j, n) \neq(i, m)} \mathbf{H}_{i m, j} \mathbf{v}_{j n} \mathbf{v}_{j n}^{\dagger} \mathbf{H}_{i m, j}^{\dagger}\right)^{-1} \mathbf{H}_{i m, i} \mathbf{v}_{i m}
γim⋆=vim†Him,i†⎝⎛σ2I+(j,n)=(i,m)∑Him,jvjnvjn†Him,j†⎠⎞−1Him,ivim
应用理论2对
f
r
C
F
f_{r}^{\mathrm{CF}}
frCF进行多维二次转换得到
f
q
C
F
f_{q}^{\mathrm{CF}}
fqCF,表示为:
f
q
C
F
(
V
,
γ
,
Y
)
=
∑
(
i
,
m
)
(
2
w
i
m
(
1
+
γ
i
m
)
Re
{
v
i
m
†
H
i
m
,
i
†
y
i
m
}
−
y
i
m
†
(
σ
2
I
+
∑
(
j
,
n
)
H
i
m
,
j
v
j
n
v
j
n
†
H
i
m
,
j
†
)
y
i
m
)
+
const
(
γ
)
f_{q}^{\mathrm{CF}}(\mathbf{V}, \gamma, \mathbf{Y})=\sum_{(i, m)}\left(2 \sqrt{w_{i m}\left(1+\gamma_{i m}\right)} \operatorname{Re}\left\{\mathbf{v}_{i m}^{\dagger} \mathbf{H}_{i m, i}^{\dagger} \mathbf{y}_{i m}\right\}-\mathbf{y}_{i m}^{\dagger}\left(\sigma^{2} \mathbf{I}+\sum_{(j, n)} \mathbf{H}_{i m, j} \mathbf{v}_{j n} \mathbf{v}_{j n}^{\dagger} \mathbf{H}_{i m, j}^{\dagger}\right) \mathbf{y}_{i m}\right)+\operatorname{const}(\gamma)
fqCF(V,γ,Y)=(i,m)∑⎝⎛2wim(1+γim)Re{vim†Him,i†yim}−yim†⎝⎛σ2I+(j,n)∑Him,jvjnvjn†Him,j†⎠⎞yim⎠⎞+const(γ)
-
注意: w i m ( 1 + γ i m ) H i m , i v i m \sqrt{w_{i m}\left(1+\gamma_{i m}\right)} \mathbf{H}_{i m, i} \mathbf{v}_{i m} wim(1+γim)Him,ivim被作为分子项,而 σ 2 I + ∑ ( j , n ) H i m , j v j n v j n † H i m , j † \sigma^{2} \mathbf{I}+\sum_{(j, n)} \mathbf{H}_{i m, j} \mathbf{v}_{j n} \mathbf{v}_{j n}^{\dagger} \mathbf{H}_{i m, j}^{\dagger} σ2I+∑(j,n)Him,jvjnvjn†Him,j†被作为分母项。此时的求解问题(52)变为:
maximize V , Y f q C F ( V , γ , Y ) subject to ∑ m = 1 M ∥ v i m ∥ 2 2 ≤ P max , ∀ i ∈ B γ i m ∈ R , y i m ∈ C N \begin{array}{ll} \underset{\mathbf{V}, \mathbf{Y}}{\operatorname{maximize}} & f_{q}^{\mathrm{CF}}(\mathbf{V}, \gamma, \mathbf{Y}) \\ \text { subject to } & \sum_{m=1}^{M}\left\|\mathbf{v}_{i m}\right\|_{2}^{2} \leq P_{\max }, \forall i \in \mathcal{B} \\ & \gamma_{i m} \in \mathbb{R}, \mathbf{y}_{i m} \in \mathbb{C}^{N} \end{array} V,Ymaximize subject to fqCF(V,γ,Y)∑m=1M∥vim∥22≤Pmax,∀i∈Bγim∈R,yim∈CN
Y \mathbf{Y} Y为集合 { y i m } \left\{y_{i m}\right\} {yim}, const ( γ ) \operatorname{const}(\gamma) const(γ)为 γ \gamma γ固定时的常数项。 -
把 f r C F f_{r}^{\mathrm{CF}} frCF改写为 f q C F f_{q}^{\mathrm{CF}} fqCF是为了利于关于 v i m \mathbf{v}_{im} vim的迭代优化。最优 y i m \mathbf{y}_{i m} yim可以通过 ∂ f q C F / ∂ y i m = 0 \partial f_{q}^{\mathrm{CF}} / \partial \mathbf{y}_{i m}=\mathbf{0} ∂fqCF/∂yim=0得到,即:
y i m ⋆ = ( σ 2 I + ∑ ( j , n ) H i m , j v j n v j n † H i m , j † ) − 1 w i m ( 1 + γ i m ) H i m , i v i m \mathbf{y}_{i m}^{\star}=\left(\sigma^{2} \mathbf{I}+\sum_{(j, n)} \mathbf{H}_{i m, j} \mathbf{v}_{j n} \mathbf{v}_{j n}^{\dagger} \mathbf{H}_{i m, j}^{\dagger}\right)^{-1}\sqrt{w_{i m}\left(1+\gamma_{i m}\right)} \mathbf{H}_{i m, i} \mathbf{v}_{i m} yim⋆=⎝⎛σ2I+(j,n)∑Him,jvjnvjn†Him,j†⎠⎞−1wim(1+γim)Him,ivim
推导:
引入功率约束的对偶变量 η i \eta_{i} ηi,首先对新的拉格朗日对偶函数 f q L f_q^L fqL重新表示有:
f q L = − ∑ ( i , m ) ( 2 w i m ( 1 + γ i m ) ( v i m † H i m , i † y i m + y i m † H i m , i v i m ) − y i m † ( σ 2 I + ∑ ( j , n ) H i m , j v j n v j n † H i m , j † ) y i m ) − const ( γ ) + ∑ ∀ i ∈ B η i ( ∑ m = 1 M v i m † v i m − P max ) f_q^L = - \sum\limits_{(i,m)} {\left( {2\sqrt {{w_{im}}\left( {1 + {\gamma _{im}}} \right)} \left( {{\mathbf{v}}_{im}^\dag {\mathbf{H}}_{im,i}^\dag {{\mathbf{y}}_{im}} + {\mathbf{y}}_{im}^\dag {{\mathbf{H}}_{im,i}}{{\mathbf{v}}_{im}}} \right) - {\mathbf{y}}_{im}^\dag \left( {{\sigma ^2}{\mathbf{I}} + \sum\limits_{(j,n)} {{{\mathbf{H}}_{im,j}}} {{\mathbf{v}}_{jn}}{\mathbf{v}}_{jn}^\dag {\mathbf{H}}_{im,j}^\dag } \right){{\mathbf{y}}_{im}}} \right)} -\operatorname{const} (\gamma ) + \sum\limits_{\forall i \in \mathcal{B}} {{\eta _i}\left( {\sum\limits_{m = 1}^M {{\mathbf{v}}_{im}^\dag {{\mathbf{v}}_{im}}} - {P_{\max }}} \right)} fqL=−(i,m)∑⎝⎛2wim(1+γim)(vim†Him,i†yim+yim†Him,ivim)−yim†⎝⎛σ2I+(j,n)∑Him,jvjnvjn†Him,j†⎠⎞yim⎠⎞−const(γ)+∀i∈B∑ηi(m=1∑Mvim†vim−Pmax)
引入trace,忽略常数项,首先对
f
q
L
f_q^L
fqL重新表示有:
f
q
L
=
f
1
+
f
2
+
f
3
f_q^L =f_1+f_2+f_3
fqL=f1+f2+f3
f 1 = − trace( w i m ( 1 + γ i m ) ( v i m † H i m , i † y i m + y i m † H i m , i v i m ) − y i m † ( σ 2 I + H i m , i v i m v i m † H i m , i † ) y i m − y i m † ( σ 2 I + ∑ ( j , n ) ≠ ( i , m ) H i m , j v j n v j n † H i m , j † ) y i m ) f_1= - {\text{trace(}}\sqrt {{w_{im}}(1 + {\gamma _{im}})} ({\mathbf{v}}_{im}^\dag {\mathbf{H}}_{im,i}^\dag {{\mathbf{y}}_{im}} + {\mathbf{y}}_{im}^\dag {{\mathbf{H}}_{im,i}}{{\mathbf{v}}_{im}}) - {\mathbf{y}}_{im}^\dag ({\sigma ^2}{\mathbf{I}} + {{\mathbf{H}}_{im,i}}{{\mathbf{v}}_{im}}{\mathbf{v}}_{im}^\dag {\mathbf{H}}_{im,i}^\dag ){{\mathbf{y}}_{im}} - {\mathbf{y}}_{im}^\dag ({\sigma ^2}{\mathbf{I}} + \sum\limits_{(j,n) \ne (i,m)} {{{\mathbf{H}}_{im,j}}} {{\mathbf{v}}_{jn}}{\mathbf{v}}_{jn}^\dag {\mathbf{H}}_{im,j}^\dag ){{\mathbf{y}}_{im}}{\text{)}} f1=−trace(wim(1+γim)(vim†Him,i†yim+yim†Him,ivim)−yim†(σ2I+Him,ivimvim†Him,i†)yim−yim†(σ2I+(j,n)=(i,m)∑Him,jvjnvjn†Him,j†)yim)
f 2 = − trace( ∑ ( j , n ) ≠ ( i , m ) ( w j n ( 1 + γ j n ) ( v j n † H j n , j † y j n + y j n † H j n , j v j n ) − y j n † ( σ 2 I + ∑ ( p , q ) H j n , p v p q v p q † H j n , p † ) y j n ) ) f_2 =- {\text{trace(}}\sum\limits_{(j,n) \ne (i,m)} {(\sqrt {{w_{jn}}(1 + {\gamma _{jn}})} ({\mathbf{v}}_{jn}^\dag {\mathbf{H}}_{jn,j}^\dag {{\mathbf{y}}_{jn}} + {\mathbf{y}}_{jn}^\dag {{\mathbf{H}}_{jn,j}}{{\mathbf{v}}_{jn}}) - {\mathbf{y}}_{jn}^\dag ({\sigma ^2}{\mathbf{I}} + \sum\limits_{(p,q)} {{{\mathbf{H}}_{jn,p}}} {{\mathbf{v}}_{pq}}{\mathbf{v}}_{pq}^\dag {\mathbf{H}}_{jn,p}^\dag ){{\mathbf{y}}_{jn}})} {\text{)}} f2=−trace((j,n)=(i,m)∑(wjn(1+γjn)(vjn†Hjn,j†yjn+yjn†Hjn,jvjn)−yjn†(σ2I+(p,q)∑Hjn,pvpqvpq†Hjn,p†)yjn))
f
3
=
trace(
∑
∀
i
∈
B
η
i
(
∑
m
=
1
M
v
i
m
†
v
i
m
−
P
max
)
)
f_3 = {\text{trace(}}\sum\limits_{\forall i \in \mathcal{B}} {{\eta _i}(\sum\limits_{m = 1}^M {{\mathbf{v}}_{im}^\dag {{\mathbf{v}}_{im}}} - {P_{\max }})} )
f3=trace(∀i∈B∑ηi(m=1∑Mvim†vim−Pmax))
利用矩阵微分有:
d
(
f
1
)
=
−
trace
(
w
i
m
(
1
+
γ
i
m
)
H
i
m
,
i
†
y
i
m
d(
v
i
m
†
)
−
H
i
m
,
i
†
y
i
m
y
i
m
†
H
i
m
,
i
v
i
m
)d(
v
i
m
†
)
)
{\text{d}}({f_1}) = - {\text{trace}}(\sqrt {{w_{im}}\left( {1 + {\gamma _{im}}} \right)} {\mathbf{H}}_{im,i}^\dag {{\mathbf{y}}_{im}}{\text{d(}}{\mathbf{v}}_{im}^\dag {\text{)}} - {\mathbf{H}}_{im,i}^\dag {{\mathbf{y}}_{im}}{\mathbf{y}}_{im}^\dag {{\mathbf{H}}_{im,i}}{{\mathbf{v}}_{im}}{\text{)d(}}{\mathbf{v}}_{im}^\dag {\text{)}})
d(f1)=−trace(wim(1+γim)Him,i†yimd(vim†)−Him,i†yimyim†Him,ivim)d(vim†))
d
(
f
2
)
=
trace
(
∑
(
j
,
n
)
≠
(
i
,
m
)
H
j
n
,
i
†
y
j
n
y
j
n
†
H
j
n
,
i
v
i
m
d(
v
i
m
†
)
)
{\text{d}}({f_2}) = {\text{trace}}(\sum\limits_{(j,n) \ne (i,m)} {{\mathbf{H}}_{jn,i}^\dag {{\mathbf{y}}_{jn}}{\mathbf{y}}_{jn}^\dag {{\mathbf{H}}_{jn,i}}{{\mathbf{v}}_{im}}{\text{d(}}{\mathbf{v}}_{im}^\dag {\text{)}}} )
d(f2)=trace((j,n)=(i,m)∑Hjn,i†yjnyjn†Hjn,ivimd(vim†))
d
(
f
3
)
=
trace
(
η
i
v
i
m
d(
v
i
m
†
)
)
{\text{d}}({f_3}) = {\text{trace}}({\eta _i}{{\mathbf{v}}_{im}}{\text{d(}}{\mathbf{v}}_{im}^\dag {\text{)}})
d(f3)=trace(ηivimd(vim†))
d
(
f
q
L
)
=
d
(
f
1
)
+
d
(
f
3
)
+
d
(
f
3
)
=
trace
(
(
(
η
i
I
+
∑
(
j
,
n
)
H
j
n
,
i
†
y
j
n
y
j
n
†
H
j
n
,
i
)
v
i
m
−
w
i
m
(
1
+
γ
i
m
)
H
i
m
,
i
†
y
i
m
)d(
v
i
m
†
)
)
{\text{d}}(f_q^L) = {\text{d}}({f_1}) + {\text{d}}({f_3}) + {\text{d}}({f_3}) = {\text{trace}}((({\eta _i}{\mathbf{I}} + \sum\limits_{(j,n)} {{\mathbf{H}}_{jn,i}^\dag {{\mathbf{y}}_{jn}}{\mathbf{y}}_{jn}^\dag {{\mathbf{H}}_{jn,i}}} ){{\mathbf{v}}_{im}} - \sqrt {{w_{im}}\left( {1 + {\gamma _{im}}} \right)} {\mathbf{H}}_{im,i}^\dag {{\mathbf{y}}_{im}}{\text{)d(}}{\mathbf{v}}_{im}^\dag {\text{)}})
d(fqL)=d(f1)+d(f3)+d(f3)=trace(((ηiI+(j,n)∑Hjn,i†yjnyjn†Hjn,i)vim−wim(1+γim)Him,i†yim)d(vim†))
则:
∂
f
q
L
∂
v
i
m
†
=
(
η
i
I
+
∑
(
j
,
n
)
H
j
n
,
i
†
y
j
n
y
j
n
†
H
j
n
,
i
)
v
i
m
−
w
i
m
(
1
+
γ
i
m
)
H
i
m
,
i
†
y
i
m
\frac{{\partial f_q^L}}{{\partial {\mathbf{v}}_{im}^\dag }} = ({\eta _i}{\mathbf{I}} + \sum\limits_{(j,n)} {{\mathbf{H}}_{jn,i}^\dag {{\mathbf{y}}_{jn}}{\mathbf{y}}_{jn}^\dag {{\mathbf{H}}_{jn,i}}} ){{\mathbf{v}}_{im}} - \sqrt {{w_{im}}\left( {1 + {\gamma _{im}}} \right)} {\mathbf{H}}_{im,i}^\dag {{\mathbf{y}}_{im}}
∂vim†∂fqL=(ηiI+(j,n)∑Hjn,i†yjnyjn†Hjn,i)vim−wim(1+γim)Him,i†yim
令
∂
f
q
L
∂
v
i
m
†
=
0
\frac{{\partial f_q^L}}{{\partial {\mathbf{v}}_{im}^\dag }} =0
∂vim†∂fqL=0,最优
V
\mathbf{V}
V为:
v
i
m
⋆
=
(
η
i
I
+
∑
(
j
,
n
)
H
j
n
,
i
†
y
j
n
y
j
n
†
H
j
n
,
i
)
−
1
w
i
m
(
1
+
γ
i
m
)
H
i
m
,
i
†
y
i
m
\mathbf{v}_{i m}^{\star}=\left(\eta_{i} \mathbf{I}+\sum_{(j, n)} \mathbf{H}_{j n, i}^{\dagger} \mathbf{y}_{j n} \mathbf{y}_{j n}^{\dagger} \mathbf{H}_{j n, i}\right)^{-1}\sqrt{w_{i m}\left(1+\gamma_{i m}\right)} \mathbf{H}_{i m, i}^{\dagger} \mathbf{y}_{i m}
vim⋆=⎝⎛ηiI+(j,n)∑Hjn,i†yjnyjn†Hjn,i⎠⎞−1wim(1+γim)Him,i†yim
由于互补松弛,
η
i
\eta_{i}
ηi其表示为:
η
i
⋆
=
min
{
η
i
≥
0
:
∑
m
=
1
M
∥
v
i
m
(
η
i
)
∥
2
2
≤
P
max
}
\eta_{i}^{\star}=\min \left\{\eta_{i} \geq 0: \sum_{m=1}^{M}\left\|\mathbf{v}_{i m}\left(\eta_{i}\right)\right\|_{2}^{2} \leq P_{\max }\right\}
ηi⋆=min{ηi≥0:m=1∑M∥vim(ηi)∥22≤Pmax}
- 注:最优 η i \eta_{i} ηi可以由二分搜索决定。整个算法5总结如下:
- 算法5是等价于著名的WMMSE算法的。(将 γ \gamma γ和 Y \mathbf{Y} Y带入 V \mathbf{V} V的更新中可以验证这一点)
- 算法3、算法5不是块坐标上升,但他们的收敛性是可以被建立的。
仿真结果
结论:图5表示为直接FP方法比闭式FP方法收敛迭代次数更少。事实上,在每次迭代的基础上,闭式FP比直接FP更有效,因为闭式FP以闭式解更新所有变量,而直接FP需要在每次迭代中求解凸优化。
能量效率最大化问题
单链路情况
考虑一个孤立的端到端无线链路。具体的参数为:
- h ∈ C h \in \mathbb{C} h∈C:链路信道
- σ 2 \sigma^{2} σ2:AWGN功率水平
总的功率约束包含两部分:
- 发送功率 p p p的功率约束: P max P_\text{max} Pmax
- 链路恒定开启功率: P ON P_\text{ON} PON
目标函数是最大化数据速率与总功耗的比率,即:能量效率,整个优化问题表示为:
maximize
p
log
(
1
+
∣
h
∣
2
p
/
σ
2
)
p
+
P
on
subject to
0
≤
p
≤
P
max
\begin{array}{cc} \underset{p}{\operatorname{maximize}} & \frac{\log \left(1+|h|^{2} p / \sigma^{2}\right)}{p+P_{\text {on }}} \\ \text { subject to } & 0 \leq p \leq P_{\max } \end{array}
pmaximize subject to p+Pon log(1+∣h∣2p/σ2)0≤p≤Pmax
- 该问题通常是非凸
单链路情况是一个single-ratio concave-convex FP 问题,其全局最优是可以找到的。应用提出的二次变换。然后这个问题被重新表述为:
maximize
p
,
y
2
y
log
(
1
+
∣
h
∣
2
p
σ
2
)
−
y
2
(
p
+
P
on
)
subject to
0
≤
p
≤
P
max
\begin{array}{ll} \underset{p, y}{\operatorname{maximize}} & 2 y \sqrt{\log \left(1+\frac{|h|^{2} p}{\sigma^{2}}\right)}-y^{2}\left(p+P_{\text {on }}\right) \\ \text { subject to } & 0 \leq p \leq P_{\max } \end{array}
p,ymaximize subject to 2ylog(1+σ2∣h∣2p)−y2(p+Pon )0≤p≤Pmax
当
p
p
p固定时,最优的
y
y
y是:
y
⋆
=
log
(
1
+
∣
h
∣
2
p
/
σ
2
)
p
+
P
o
n
y^{\star}=\frac{\sqrt{\log \left(1+|h|^{2} p / \sigma^{2}\right)}}{p+P_{\mathrm{on}}}
y⋆=p+Ponlog(1+∣h∣2p/σ2)
当
y
y
y固定时,最优
p
p
p是一个凸问题,可以使用凸优化的方法求得。
多链路情况
跨多个干扰环节的能源效率最大化是一个更具挑战性的问题。考虑一个空间多路多天线广播信道模型,一个发送端配有 M M M个天线,向 M M M个接收端发送单个数据。假设每个接收器都有 N N N个天线,并且支持一个数据流。具体参数如下:
- H m ∈ C N × M \mathbf{H}_{m} \in \mathbb{C}^{N \times M} Hm∈CN×M:发送端到第 m m m个接收器的信道
- v m ∈ C M \mathbf{v}_{m} \in \mathbb{C}^{M} vm∈CM:对第 m m m个用户的发送波束赋形
在这种情况下,能源效率最大化问题被表述为
maximize
V
∑
m
=
1
M
R
m
(
V
)
∑
m
=
1
M
∥
v
m
∥
2
2
+
P
on
subject to
∑
m
=
1
M
∥
v
m
∥
2
2
≤
P
max
\begin{array}{ll} \underset{\mathbf{V}}{\operatorname{maximize}} & \frac{\sum_{m=1}^{M} R_{m}(\mathbf{V})}{\sum_{m=1}^{M}\left\|\mathbf{v}_{m}\right\|_{2}^{2}+P_{\text {on }}} \\ \text { subject to } & \sum_{m=1}^{M}\left\|\mathbf{v}_{m}\right\|_{2}^{2} \leq P_{\max } \end{array}
Vmaximize subject to ∑m=1M∥vm∥22+Pon ∑m=1MRm(V)∑m=1M∥vm∥22≤Pmax
其中:
R
m
(
V
)
=
log
(
1
+
v
m
†
H
m
†
(
σ
2
I
+
∑
n
≠
m
H
m
v
n
v
n
†
H
m
†
)
−
1
H
m
v
m
)
{R_m}({\mathbf{V}}) = \log (1 + {\mathbf{v}}_m^\dag {\mathbf{H}}_m^\dag {({\sigma ^2}{\mathbf{I}} + \sum\limits_{n \ne m} {{{\mathbf{H}}_m}} {{\mathbf{v}}_n}{\mathbf{v}}_n^\dag {\mathbf{H}}_m^\dag )^{ - 1}}{{\mathbf{H}}_m}{{\mathbf{v}}_m})
Rm(V)=log(1+vm†Hm†(σ2I+n=m∑Hmvnvn†Hm†)−1Hmvm)
R
m
(
V
)
R_{m}(\mathbf{V})
Rm(V)表示第m个接收器的速率。
如考虑前面所述的Dinkelbach’s transform,转换后的目标函数为:
f
d
(
V
,
y
)
=
∑
m
=
1
M
R
m
(
V
)
−
y
(
∑
m
=
1
M
∥
v
m
∥
2
2
+
P
o
n
)
f_{d}(\mathbf{V}, y)=\sum_{m=1}^{M} R_{m}(\mathbf{V})-y\left(\sum_{m=1}^{M}\left\|\mathbf{v}_{m}\right\|_{2}^{2}+P_{\mathrm{on}}\right)
fd(V,y)=m=1∑MRm(V)−y(m=1∑M∥vm∥22+Pon)
- 与单链情况不同的是, f d f_{d} fd对于 V \mathbf{V} V不在是一个凸函数,求解十分困难,故Dinkelbach’s transform很难拓展到多链路情况
应用前面的单比二次变换,解耦能量效率函数为:
f
q
(
V
,
y
)
=
2
y
(
∑
m
=
1
M
R
m
(
V
)
)
1
2
−
y
2
(
∑
m
=
1
M
∥
v
m
∥
2
2
+
P
o
n
)
f_{q}(\mathbf{V}, y)=2 y\left(\sum_{m=1}^{M} R_{m}(\mathbf{V})\right)^{\frac{1}{2}}-y^{2}\left(\sum_{m=1}^{M}\left\|\mathbf{v}_{m}\right\|_{2}^{2}+P_{\mathrm{on}}\right)
fq(V,y)=2y(m=1∑MRm(V))21−y2(m=1∑M∥vm∥22+Pon)
- 现在出现了与Dinkelbach变换方法相同的问题:重新表述的目标函数在 v m \mathbf{v}_m vm上不是凹的。但平方根函数是非减凹的,以及第二项是凹的。因此, v m \mathbf{v}_m vm的凹性可以被恢复,如果平方根函数里面的 ∑ m = 1 M R m \sum_{m=1}^{M} R_{m} ∑m=1MRm可以被重铸
对
R
m
R_{m}
Rm里面的每一项SINR进行多维二次变换将
f
q
f_{q}
fq重铸为
f
q
q
f_{qq}
fqq,即:
f
q
q
(
V
,
y
,
Z
)
=
2
y
(
∑
m
=
1
M
log
(
1
+
2
Re
{
z
m
†
H
m
v
m
}
−
z
m
†
(
σ
2
I
+
∑
n
≠
m
H
m
v
n
v
n
†
H
m
†
)
z
m
)
)
1
2
−
y
2
(
∑
m
=
1
M
∥
v
m
∥
2
2
+
P
o
n
)
,
(
70
)
f_{q q}(\mathbf{V}, y, \mathbf{Z})=2 y\left(\sum_{m=1}^{M} \log \left(1+2 \operatorname{Re}\left\{\mathbf{z}_{m}^{\dagger} \mathbf{H}_{m} \mathbf{v}_{m}\right\}-\mathbf{z}_{m}^{\dagger}\left(\sigma^{2} \mathbf{I}+\sum_{n \neq m} \mathbf{H}_{m} \mathbf{v}_{n} \mathbf{v}_{n}^{\dagger} \mathbf{H}_{m}^{\dagger}\right) \mathbf{z}_{m}\right)\right)^{\frac{1}{2}}-y^{2}\left(\sum_{m=1}^{M}\left\|\mathbf{v}_{m}\right\|_{2}^{2}+P_{\mathrm{on}}\right),\quad (70)
fqq(V,y,Z)=2y⎝⎛m=1∑Mlog⎝⎛1+2Re{zm†Hmvm}−zm†⎝⎛σ2I+n=m∑Hmvnvn†Hm†⎠⎞zm⎠⎞⎠⎞21−y2(m=1∑M∥vm∥22+Pon),(70)
此时的求解问题为:
maximize
v
,
y
,
Z
f
q
q
(
V
,
y
,
Z
)
subject to
∑
m
=
1
M
∥
v
m
∥
2
2
≤
P
max
z
m
∈
C
N
\begin{array}{ll} \underset{\mathbf{v}, y, \mathbf{Z}}{\operatorname{maximize}} & f_{q q}(\mathbf{V}, y, \mathbf{Z}) \\ \text { subject to } & \sum_{m=1}^{M}\left\|\mathbf{v}_{m}\right\|_{2}^{2} \leq P_{\max } \\ & \mathbf{z}_{m} \in \mathbb{C}^{N} \end{array}
v,y,Zmaximize subject to fqq(V,y,Z)∑m=1M∥vm∥22≤Pmaxzm∈CN
采用交替迭代,当其他的变量被固定时,最优
z
m
\mathbf{z}_{m}
zm为:
z
m
⋆
=
(
σ
2
I
+
∑
n
≠
m
H
m
v
n
v
n
†
H
m
†
)
−
1
H
m
v
m
,
(
72
)
\mathrm{z}_{m}^{\star}=\left(\sigma^{2} \mathbf{I}+\sum_{n \neq m} \mathbf{H}_{m} \mathbf{v}_{n} \mathbf{v}_{n}^{\dagger} \mathbf{H}_{m}^{\dagger}\right)^{-1} \mathbf{H}_{m} \mathbf{v}_{m},\quad (72)
zm⋆=⎝⎛σ2I+n=m∑Hmvnvn†Hm†⎠⎞−1Hmvm,(72)
同样,
z
m
\mathbf{z}_{m}
zm更新完后,最优
y
y
y为:
y
⋆
=
∑
m
=
1
M
R
m
(
V
)
∑
m
=
1
M
∥
v
m
∥
2
2
+
P
o
n
,
(
73
)
y^{\star}=\frac{\sqrt{\sum_{m=1}^{M} R_{m}(\mathbf{V})}}{\sum_{m=1}^{M}\left\|\mathbf{v}_{m}\right\|_{2}^{2}+P_{\mathrm{on}}},\quad (73)
y⋆=∑m=1M∥vm∥22+Pon∑m=1MRm(V),(73)
当 z m \mathbf{z}_{m} zm和 y y y都被固定时,对于 v m \mathbf{v}_{m} vm是一个凸问题,可以通过数值的方法求得。整个算法步骤总结为算法6: