笔记(待续)-基于梯度下降法的RBF神经网络控制

最新推荐文章于 2024-04-25 11:11:56 发布

Leweslyh

最新推荐文章于 2024-04-25 11:11:56 发布

阅读量3.3k

点赞数 5

分类专栏：控制理论

本文链接：https://blog.csdn.net/weixin_41235419/article/details/115654502

版权

控制理论专栏收录该内容

9 篇文章 8 订阅

订阅专栏

在离散神经网络控制系统中，常采用梯度下降法实现神经网络权值的学习。

一、基于RBF神经网络的监督控制

基于RBF神经网络的监督控制：初始阶段采用PD反馈控制，然后过渡到神经网络控制。在控制过程中，如果出现较大的误差，则PD控制起主导作用，神经网络控制起调节作用。

图1：基于RBF神经网络的监督控制系统框图

总的控制输入为 $u(k) = u_n(k) + u_p(k)$ ，误差指标为（有点儿费解）：
$\frac{1}{2} (u_n(k) - u(k))^2$

采用梯度下降法，网络权值学习算法为：
$\begin{aligned} & \Delta w_j(k) = - \eta \frac{\partial E(k)}{\partial w_j} = \eta (u_n(k) - u(k)) h_j(k) \\ & w_j(k) = w_j(k-1) + \Delta w_j(k) + \alpha (w_j(k-1) - w_j(k-2)) \end{aligned} \tag{1}$

其中， $\eta$ 为学习速率， $\eta \in [0,1]$ ； $\alpha$ 为动量因子， $\alpha \in [0,1]$ 。

二、基于RBF神经网络的模型参考自适应控制

什么是学习呢？就是根据一定的规则（梯度下降法），通过加入新的数据来不断调整神经网络的参数。

这一部分的思想和笔记-神经网络滑模控制设计方法的《基于神经网络的直接自适应滑模控制》类似。

图1：基于RBF神经网络的模型参考自适应控制系统框图

设理想跟踪指令为 $y_m(k)$ ，定义跟踪误差为：
$e(k) = y_m(k) - y(k)$

网络权值学习误差指标为：
$\frac{1}{2} e(k)^2$

控制输入为RBF神经网络的输出：
$h_1 w_1 + \cdots + h_j w_j + \cdots + h_m w_m$

其中， $m$ 为隐藏层的节点个数， $w_j$ 为节点的权值， $h_j$ 为高斯基函数的输出。

根据梯度下降法，网络的学习算法为：
$\begin{aligned} & \Delta w_j(k) = - \eta \frac{\partial E(k)}{\partial w} = \eta e_c(k) \frac{\partial y (k)}{\partial u (k)} h_j \\ & w_j(k) = w_j(k-1) + \Delta w_j(k) + \alpha \Delta w_j(k) \end{aligned} \tag{1}$

其中， $\eta$ 为学习速率， $\eta \in [0,1]$ ； $\alpha$ 为动量因子， $\alpha \in [0,1]$ 。

同理，可得：
$\begin{aligned} & \Delta b_j(k) = - \eta \frac{\partial E(k)}{\partial b_j} = \eta e_c(k) \frac{\partial y(k)}{\partial u(k)} \frac{\partial u(k)}{\partial b_j} = \eta e_c(k) \frac{\partial y(k)}{\partial u(k)} w_j h_j \frac{|| \boldsymbol{x} - \boldsymbol{c}_ij ||^2}{b_j^3} \\ & b_j(k) = b_j(k-1) + \eta \Delta b_j(k) + \alpha \left( b_j(k-1) - b_j(k-2) \right) \end{aligned} \tag{2}$

和
$\begin{aligned} & \Delta c_{ij}(k) = - \eta \frac{\partial E(k)}{\partial c_{ij}} = \eta e_c(k) \frac{\partial y(k)}{\partial u(k)} \frac{\partial u(k)}{\partial c_{ij}} = \eta e_c(k) \frac{\partial y(k)}{\partial u(k)} w_j h_j \frac{x_i - c_{ij}}{b_j^2} \\ & c_{ij}(k) = c_{ij}(k-1) + \eta \Delta c_{ij}(k) + \alpha \left( c_{ij}(k-1) - c_{ij}(k-2) \right) \end{aligned} \tag{3}$

其中， $\frac{\partial y(k)}{\partial u(k)}$ 为Jacobian矩阵，表征系统输出对控制输入的灵敏度。

三、RBF自校正控制

即用RBF神经网络逼近被控对象的未知部分，其设计思想和笔记-神经网络滑模控制设计方法的《一种简单的RBF网络自适应滑模控制》类似。

四、总结

《RBF神经网络自适应控制MATLAB仿真》一书，RBF神经网络的作用和多项式逼近、模糊逼近等是一样的，都满足万能逼近原理，用来逼近/拟合模型未知部分。
感觉和局部线性化思想有点共通的地方。
为什么叫“学习算法”呢？就是根据一定的规则（比如本书第三章的梯度下降法），随着数据的增加，对RBF神经网络中的参数进行调整。

什么是快乐星球，什么是快乐星球，如果你想知道什么是快乐星球的话，我现在就带你研究，什么是快乐星球。

参考文献

刘金琨. RBF神经网络自适应控制matlab仿真[M]. 清华大学出版社, 2014.

Leweslyh

关注

5
点赞
踩
26

收藏

觉得还不错? 一键收藏
打赏
2
评论
笔记(待续)-基于梯度下降法的RBF神经网络控制

在离散神经网络控制系统中，常采用梯度下降法实现神经网络权值的学习。一、基于RBF神经网络的监督控制基于RBF神经网络的监督控制：初始阶段采用PD反馈控制，然后过渡到神经网络控制。在控制过程中，如果出现较大的误差，则PD控制起主导作用，神经网络控制起调节作用。图1：基于RBF神经网络的监督控制系统框图总的控制输入为u(k)=un(k)+up(k)u(k) = u_n(k) + u_p(k)u(k)=un(k)+up(k)，误差指标为（有点儿费解）：E(k)=12(un(k)−u(k))2
复制链接

扫一扫