最陡下降法矢量迭代公式:
w
(
n
+
1
)
=
w
(
n
)
+
μ
(
−
∇
(
n
)
)
\boldsymbol{w(n+1)}=\boldsymbol{w(n)}+\mu(-\boldsymbol{\nabla}(n))
w(n+1)=w(n)+μ(−∇(n))
其中梯度
∇
=
R
w
(
n
)
−
P
\boldsymbol{\nabla}=\boldsymbol{Rw(n)-P}
∇=Rw(n)−P代入上式:
w
(
n
+
1
)
=
w
(
n
)
−
2
μ
(
R
w
(
n
)
−
P
)
\boldsymbol{w(n+1)}=\boldsymbol{w(n)}-2\mu(\boldsymbol{Rw(n)-P})
w(n+1)=w(n)−2μ(Rw(n)−P)
而梯度为零的地方为为维纳解
w
∗
=
P
/
R
w^*=\boldsymbol{P/R}
w∗=P/R
所以:
w
(
n
+
1
)
=
w
(
n
)
−
2
μ
R
(
w
(
n
)
−
w
∗
)
=
[
I
−
2
μ
R
]
w
(
n
)
+
2
μ
R
w
∗
\begin{aligned} \boldsymbol{w(n+1)}&=\boldsymbol{w(n)}-2\mu\boldsymbol{R}(\boldsymbol{w(n)-w^*}) \\ &=[\boldsymbol{I-2\mu R}]w(n)+2\mu R w^* \end{aligned}
w(n+1)=w(n)−2μR(w(n)−w∗)=[I−2μR]w(n)+2μRw∗
由于上式
w
(
n
)
w(n)
w(n)的系数矩阵不是对角阵(不是对角阵的话求解矩阵方程计算量会很大),所以这里我把
w
w
w坐标系通过平移和旋转变成主轴坐标
v
′
v'
v′,所以:
v
′
(
n
+
1
)
=
[
I
−
2
μ
Λ
]
v
′
(
n
+
)
\boldsymbol{v'(n+1)}=[\boldsymbol{I-2\mu \Lambda}] \boldsymbol{v'(n+)}
v′(n+1)=[I−2μΛ]v′(n+)
重点来了,通过标量迭代推导:
v
′
(
n
+
1
)
=
[
I
−
2
μ
Λ
]
n
v
′
(
0
)
\boldsymbol{v'(n+1)}=[\boldsymbol{I-2\mu \Lambda}]^n \boldsymbol{v'(0)}
v′(n+1)=[I−2μΛ]nv′(0)
通过观察上式,系数矩阵是一个
n
n
n次幂阵,为了使算法稳定,而不会因为迭代次数爆炸,所以:
lim
n
→
∞
[
I
−
2
μ
Λ
]
n
=
0
\lim_{n\to \infty}[\boldsymbol{I-2\mu \Lambda}]^n=\boldsymbol{0}
n→∞lim[I−2μΛ]n=0
或者写成标量表达:
lim
n
→
∞
[
1
−
2
μ
λ
k
]
n
=
0
\lim_{n\to \infty}[1-2\mu \lambda_k]^n=0
n→∞lim[1−2μλk]n=0
所以:
∣
1
−
2
μ
λ
k
∣
<
1
,
k
=
0
,
1
,
…
|1-2\mu \lambda_k|<1,k=0,1,\dots
∣1−2μλk∣<1,k=0,1,…
终于推导出来了
0
<
μ
<
λ
m
a
x
−
1
0<\mu<\lambda_{max}^{-1}
0<μ<λmax−1
上式中,
λ
m
a
x
\lambda_{max}
λmax是
R
\boldsymbol{R}
R最大特征值。
回答贴:关于LMS算法步长范围推导
最新推荐文章于 2023-06-22 16:38:32 发布