递推最小二乘RLS推导

最新推荐文章于 2024-07-28 08:40:13 发布

ML_CS

最新推荐文章于 2024-07-28 08:40:13 发布

阅读量1.5w

点赞数 25

分类专栏：系统辨识文章标签：递推最小二乘

本文链接：https://blog.csdn.net/qq_27436347/article/details/89766494

版权

系统辨识专栏收录该内容

7 篇文章 3 订阅

订阅专栏

批次的最小二乘是给定一批数据比如 $\{y_i\in\mathbb{R},x_i\in \mathbb{R}^n,i=1,...,N\}$ ，满足 $y_i = x_i^T\theta$ 从而辨识 $\times 1$ 维参数向量 $\theta = [\theta_1,...,\theta_n]$
写成紧凑的形式为 $Y_N = X_N \theta$ 其中 $Y_N\in \mathbb{R}^N$ ， $X_N$ 是个 $N\times n$ 的矩阵，每一行对应一个 $x_i^T$
估计的参数 $\hat{\theta}$ 越准，则模型的预测值 $X_N\hat{\theta}$ 的结果越接近 $Y_N$ ，因此我们的目标是最小化估计的误差 $||Y_N - X_N\hat{\theta}||_2$ 对 $\hat{\theta}$ 求导 $X_N^T(Y_N-X_N\hat{\theta})=0\\ X_N^TY_N-X_N^TX_N\hat{\theta}=0$ 得到 $\hat{\theta} = (X_N^TX_N)^{-1}X_N^TY_N \tag{1}$ 也就是说如果在 $t$ 时刻有了 $N$ 组数据，我们就可以用 $(1)$ 来辨识模型参数 $\hat{\theta}_t$ 。
那么问题来了，每个时刻会有新的数据进来，都这么一搞也太折腾了，于是有了递推最小二乘，目的在于每步更新模型参数是基于上一时刻的模型参数以及这一时刻的数据进行修正，即
$\hat{\theta}_t = \hat{\theta}_{t-1} + 修正量f(y_t,x_t)$ 观察公式 $(1)$ ，需要建立相邻两个时刻之间的关系，首先定义变量 $P_N^{-1} = (X_N^TX_N)$ ，即 $P_N^{-1} = [x_1,x_2,...,x_N][x_1^T;x_2^T;...;x_N^T]\\ =\sum_{i=1}^{N-1}x_ix_i^T+x_Nx_N^T\\ =P_{N-1}^{-1}+x_Nx_N^T\tag{2}$ 同理 $X_N^TY_N=X_{N-1}^TY_{N-1}+x_Ny_N \tag{3}$ 利用公式 $(2) (3)$ 重新梳理公式 $(1)$ $\hat{\theta}_t = P_N(X_{N-1}^TY_{N-1}+x_Ny_N) \tag{4}$ 利用 $\hat{\theta}_{t-1} = P_{N-1} X_{N-1}^TY_{N-1}\\ P_{N-1}^{-1} \hat{\theta}_{t-1} = X_{N-1}^TY_{N-1} \tag{5}$ 将 $(5)$ 带入 $(4)$ $\hat{\theta}_t = P_N(P_{N-1}^{-1} \hat{\theta}_{t-1}+x_Ny_N)\\ =P_N(P_N^{-1}-x_Nx_N^T)\hat{\theta}_{t-1} + P_Nx_Ny_N\\ =\hat{\theta}_{t-1} + P_Nx_Ny_N-P_Nx_Nx_N^T\hat{\theta}_{t-1}\\ =\hat{\theta}_{t-1} + P_N(x_Ny_N-x_Nx_N^T\hat{\theta}_{t-1}) \tag{6}$ 由 $(2)$ 可得 $P_N=(P_{N-1}^{-1}+x_Nx_N^T)^{-1}$ 根据

矩阵逆引理：
$A+BCD]^{-1}=A^{-1}-A^{-1}B[C^{-1}+DA^{-1}B]^{-1}DA^{-1}$

$P_N=P_{N-1}-P_{N-1}x_N[I+x_N^TP_{N-1}x_N]^{-1}x_N^TP_{N-1} \tag{7}$ 因此RLS的求解为
$P_N=P_{N-1}-P_{N-1}x_N[I+x_N^TP_{N-1}x_N]^{-1}x_N^TP_{N-1}\\ \hat{\theta}_t=\hat{\theta}_{t-1} + P_Nx_N(y_N-x_N^T\hat{\theta}_{t-1})$ 其中， $(y_N-x_N^T\hat{\theta}_{t-1})$ 相当于 $t - 1$ 时刻的参数用于 $t$ 时刻预测时带来的偏差， $P_Nx_N$ 相当于修正系数