自适应滤波器：最速下降算法

最新推荐文章于 2024-09-11 06:30:00 发布

bakalaka

最新推荐文章于 2024-09-11 06:30:00 发布

阅读量3.9k

点赞数 2

分类专栏：自适应滤波器理论课程

原文链接：https://www.cnblogs.com/xingshansi/p/6654372.html

版权

自适应滤波器理论课程专栏收录该内容

8 篇文章 38 订阅

订阅专栏

本文转载自：http://www.cnblogs.com/xingshansi/p/6654372.html

前言

西蒙.赫金的《自适应滤波器原理》第四版第四章：最速下降算法。优化求解按照有/无约束分类：如投影梯度下降算法（(Gradient projection）便是有约束的优化求解；按照一阶二阶分类：梯度下降（Gradient descent）、Newton法等；按照偏导存在与否分类：如梯度下降、次梯度下降（Subgradient descent）等.本文主要整理：梯度下降法在维纳滤波中的应用.

一、原理思想

对于准则函数：

需要寻找最优解 $w_{o}$ ，使它对所有满足。可以利用迭代下降的思路求解：

从初始值 $w_{o}$ 出发，产生一系列权向量，...，使得准则函数每一次迭代都是下降的：，其中是权向量的过去值，是更新值。

定义梯度：

负梯度方向为减小方向：

为了说明准则函数随着迭代下降，从一阶泰勒展开可以观察：

二、应用实例

仍然借助维纳滤波一文的例子：

已知：

含有噪声的正弦波：.

其中为归一化频率[-1/2, 1/2]，θ为正弦波相位，服从[0, 2π]的均匀分布，为具有零均值和方差的高斯白噪声。

求：

时域维纳滤波器。假设滤波器为时域滤波器时M=2.

首先求解相关矩阵：

x(n) 为广义平稳随机过程，可以计算其自相关函数：

得到关于均方误差的准则函数：

代入数值：

迭代的时候，可以保留矩阵的形式，也可以利用代数的形式，形式不同但本质相同，以矩阵为例：

得到梯度.

对应搜索代码：

r_yd = [0.5 0.154]';
R_yy = [2.5 0.154;0.154 2.5];
h_est = [0 0]';
deltaJold = Inf;
mu = 0.001;
for i = 1:2000
    deltaJ = -2*r_yd+2*R_yy*h_est;
    if abs(deltaJ-deltaJold)<1e-5
        break;
    end
    h_est = h_est - mu*deltaJ
    deltaJold = deltaJ;
end

即可得出最优解

。

三、稳定性

上文中μ取0.001，μ如何取值才能保证梯度正常下降呢？事实上，如果μ过大结果会往外发散而不是收敛于最优点。

借助维纳滤波一文可以知道，

从而有：

记:

对于正定矩阵，存在正交矩阵：

即，为此保证最大特征值小于1即可保证收敛：

如对应上面h的求解，，用上面的程序容易验证μ=0.37时满足条件，可以收敛；μ=0.38则发散，无法得到最优值。

四、理论扩展

如果沿着曲线直接寻优，我们称为：精确直线搜索。如计算：：

这是就是Δx与x固定后，该问题就是t的函数，易求解。但实际情况中，准则函数并不总是这么理想，因此借助近似的思路去寻优，成了一种更普适的方式，梯度下降法、牛顿法都是基于该思路。

这里给出一个更简单的例子y=kx的拟合问题，其中k未知。

首先给出结果图：

100组随机试验，未添加噪声。

给出code：

N = 100;
a = zeros(1,N);
mu =0.002;
flag = 2;
for k = 1:N
    xold = linspace(-10,10,60);
    nums = randperm(length(xold));
    x = xold(nums);
    y = 3*x +2*randn(1,length(x));
    switch flag
        case 1
            a_est = 0;
            batch = 10;
            for i=1:batch:length(x)
                a_est = a_est+mu*(x(i:i+batch-1)*(y(i:i+batch-1)-a_est*x(i:i+batch-1)).');
            end
        case 2
            a_est = 0;
            batch = 1;
            for i=1:batch:length(x)
                a_est = a_est+mu*(x(i:i+batch-1)*(y(i:i+batch-1)-a_est*x(i:i+batch-1)).');
            end
    end
    a(k) = a_est;
end

对于相关矩阵：来自统计均方误差，但实际应用中通常无法得知概率分布以及相关矩阵，通常是基于遍历性假设， 以便利用时间换取空间。即：