【模糊神经网络】基于模糊神经网络的倒立摆轨迹跟踪控制

StopTheWorld丶

已于 2024-03-20 10:30:02 修改

阅读量2.1k

点赞数 2

分类专栏：模糊控制神经网络文章标签：模糊神经网络轨迹跟踪控制

于 2023-01-29 19:57:45 首次发布

本文链接：https://blog.csdn.net/ndjasdn/article/details/128791525

版权

模糊控制同时被 2 个专栏收录

2 篇文章 6 订阅

订阅专栏

神经网络

1 篇文章 0 订阅

订阅专栏

临近春节没啥事做，突然想起前两年未完成的模糊神经网络，当时是学了一段时间，但是到最后矩阵求偏导那块始终不对，最后也不了了之了，趁最近有空，想重新回顾回顾，看看会不会产生新的想法。经过不断尝试后，竟然达到了想要的效果，所以简要记录一下留个笔记。以下内容只讲干货，不玩虚的。

0 引言

模糊神经网络结合了模糊控制与神经网络两者的优点，不仅具备对非线性、时变、模型不完全系统的控制，同时还具备很好的自学习和自适应能力。模糊神经网络主要用于模型控制以及函数逼近等领域。

1 倒立摆模型

被控对象为单级倒立摆，其动力学方程为 $\dot{x}_1=x_2 \\ \dot{x}_2=f\left( \boldsymbol{x} \right) +g\left( \boldsymbol{x} \right) u$ 其中， $f\left( \boldsymbol{x} \right) =\frac{g\sin x_1-mlx_{2}^{2}\cos x_1\sin x_1/\left( m_c+m \right)}{l\left( 4/3-m\cos ^2x_1/\left( m_c+m \right) \right)}$ ； $g\left( \boldsymbol{x} \right) =\frac{\cos x_1/\left( m_c+m \right)}{l\left( 4/3-m\cos ^2x_1/\left( m_c+m \right) \right)}$ ， $x_1$ 和 $x_2$ 分别为摆角和摆速， $g$ 为重力加速度， $m_c$ 为小车质量， $m$ 摆的质量， $l$ 为摆长的一半， $u$ 为控制输入。

2 控制器设计

2.1 模糊神经网络结构

第一层：输入层。输入层为双输入，分别为系统偏差 $e$ 和系统偏差变化率 $\dot{e}$ ，然后通过激活函数 $f_1\left( x \right)$ 输出到模糊化层。 $f_1\left( x_i \right) =x_i$ 第二层：模糊化层。本层的激活函数即隶属函数，采用逼近能力较好的高斯函数 $f_2\left( i,j \right) =\exp \left[ -\frac{\left( x_i-c_{ij} \right) ^2}{2\sigma _{ij}^{2}} \right]$ 其中， $i = 1, 2 ； j = 1, 2, ... n ；$ $c_{ij}$ 和 $\sigma _{ij}$ 分别为高斯函数的中心和基宽。
第三层：模糊推理层。本层使用的激活函数为 $\varphi \left( j \right) =\prod_{j=1}^N{f_2\left( i,j \right)} \\ f_3\left( j \right) =\frac{\varphi \left( j \right)}{\sum_{j=1}^N{\varphi \left( j \right)}}$ 其中， $N=\prod_{i=1}^n{n_i}$ ，为神经元和。
第四层：输出层。本层主要是输出模型控制量 $u$ 。 $f_4\left( i \right) =\boldsymbol{\omega }\cdot f_3=\sum_{j=1}^N{\boldsymbol{w}\left( i,j \right) \cdot f_3\left( j \right)}$ 其中， $\boldsymbol{\omega }$ 为模糊推理层与输出层的连接权矩阵。

2.2 模糊神经网络的训练算法

LM算法结合高斯牛顿算法和梯度下降法，兼具局部收敛法和全局搜索的优点。但是，由于LM算法的计算复杂度和存储容量会随着训练样本数目的增加而增加，为了解决该问题，利用IALM算法优化所有的参数。参数向量 $\boldsymbol{\varTheta }\left( t \right)$ 的更新规则如下： $\boldsymbol{\varTheta }\left( t+1 \right) =\boldsymbol{\varTheta }\left( t \right) -\left( \boldsymbol{\varPsi }\left( t \right) +\eta \left( t \right) \boldsymbol{I} \right) ^{-1}\boldsymbol{\varOmega }\left( t \right)$ 其中， $\boldsymbol{\varTheta }\left( t \right) =\left[ \boldsymbol{\omega }\left( t \right) , \boldsymbol{c}\left( t \right) , \boldsymbol{\sigma }\left( t \right) \right] ^{\mathrm{T}}$ 为参数向量， $\boldsymbol{I}$ 为用于矩阵求逆时避免奇异的单位矩阵， $\boldsymbol{\varPsi }\left( t \right)$ 为准海森(quasi-Hessian)矩阵， $\boldsymbol{\varOmega }\left( t \right)$ 为梯度向量。自适应学习率 $\boldsymbol{\eta }\left( t \right)$ 的调整规则如下： $\boldsymbol{\eta }\left( t \right) =\beta _m\left\| \boldsymbol{e}\left( t \right) \right\| +\left( 1-\beta _m \right) \left\| \boldsymbol{\varOmega }\left( t \right) \right\|$ 其中， $\beta _m\left( 0<\beta _m<1 \right)$ 为预设的常量， $\boldsymbol{\varPsi }\left( t \right)$ 和 $\boldsymbol{\varOmega }\left( t \right)$ 分别为所有样本的子矩阵 $\boldsymbol{\psi }_p\left( t \right)$ 和子向量 $\boldsymbol{\omega }_p\left( t \right)$ 的累加，即 $\boldsymbol{\varPsi }\left( t \right) =\sum_{p=1}^P{\boldsymbol{\psi }_p\left( t \right)} \\ \boldsymbol{\varOmega }\left( t \right) =\sum_{p=1}^P{\boldsymbol{\omega }_p\left( t \right)}$ 其中，子矩阵 $\boldsymbol{\psi }_p\left( t \right)$ 和子向量 $\boldsymbol{\omega }_p\left( t \right)$ 分别定义为 $\boldsymbol{\psi }_p\left( t \right) =\dot{J}_{p}^{\mathrm{T}}\left( t \right) \dot{J}_P\left( t \right) \\ \boldsymbol{\varOmega }\left( t \right) =\dot{J}_{p}^{\mathrm{T}}\left( t \right) e_P\left( t \right)$ 其中， $e_P\left( t \right)$ 为对于第 $p$ 个样本，期望输出和网络实际输出之间的误差 $e_P\left( t \right) =y_{d}^{p}\left( t \right) -y^p\left( t \right) , p=1,2,...P$ ， $\dot{J}_p\left( t \right)$ 为 $\mathrm{Jacobian}$ 矩阵的行向量，即 $\dot{J}_p\left( t \right) =\left[ \frac{\partial e_p}{\partial w_1},...,\frac{\partial e_p}{\partial w_r},\frac{\partial e_p}{\partial c_{11}},...,\frac{\partial e_p}{\partial c_{ij}},...,\frac{\partial e_p}{\partial c_{nr}},\frac{\partial e_p}{\partial \sigma _{11}},...,\frac{\partial e_p}{\partial \sigma _{ij}},...,\frac{\partial e_p}{\partial \sigma _{nr}} \right]$ 根据梯度下降学习算法的更新规则， $\mathrm{Jacobian}$ 矩阵行向量的元素可表示为 $\frac{\partial e_p\left( t \right)}{\partial w_j\left( t \right)}=-h_j\left( t \right) \\ \frac{\partial e_p\left( t \right)}{\partial c_{ij}\left( t \right)}=-w_j\left( t \right) \frac{\sum_{k\ne j}^r{\varphi _k\left( t \right)}}{\left( \sum_{k=1}^r{\varphi _k\left( t \right)} \right) ^2}\prod_{k\ne i}^n{\mu _{kj}\left( t \right) \frac{\partial \mu _{ij}\left( t \right)}{\partial c_{ij}\left( t \right)}} \\ \frac{\partial e_p\left( t \right)}{\partial \sigma _{ij}\left( t \right)}=-w_j\left( t \right) \frac{\sum_{k\ne j}^r{\varphi _k\left( t \right)}}{\left( \sum_{k=1}^r{\varphi _k\left( t \right)} \right) ^2}\prod_{k\ne i}^n{\mu _{kj}\left( t \right) \frac{\partial \mu _{ij}\left( t \right)}{\partial \sigma _{ij}\left( t \right)}}$ 其中， $\frac{\partial \mu _{ij}\left( t \right)}{\partial c_{ij}\left( t \right)}=\frac{2\left( x_i\left( t \right) -c_{ij}\left( t \right) \right) \exp \left( -\left( x_i\left( t \right) -c_{ij}\left( t \right) \right) ^2/\sigma _{ij}^{2}\left( t \right) \right)}{\sigma _{ij}^{2}\left( t \right)} \\ \frac{\partial \mu _{ij}\left( t \right)}{\partial \sigma _{ij}\left( t \right)}=\frac{2\left( x_i\left( t \right) -c_{ij}\left( t \right) \right) ^2\exp \left( -\left( x_i\left( t \right) -c_{ij}\left( t \right) \right) ^2/\sigma _{ij}^{2}\left( t \right) \right)}{\sigma _{ij}^{3}\left( t \right)}$ 至此，就是IALM算法的所有公式，根据以上步骤，便可编写出模糊神经网络各层的程序以及参数向量的学习算法，控制器程序也就得到了。
IALM算法相比LM算法来说，可以直接计算准海森矩阵 $\boldsymbol{\varPsi }\left( t \right)$ 和梯度向量 $\boldsymbol{\varOmega }\left( t \right)$ ，不需要执行 $\mathrm{Jacobian}$ 矩阵的乘法，从而降低了算法计算复杂度，并且自适应学习率 $\boldsymbol{\eta }\left( t \right)$ 也有助于加快学习速度和提高泛化能力。

3 模型搭建与仿真

仿真目的：使用模糊神经网络控制器控制倒立摆完成轨迹跟踪运动。
在Simulink中搭建如下图所示的系统模型：

参数设置：取 $x_1=\theta$ ，期望轨迹为 $\theta _{\mathrm{d}}\left( t \right) =0.1\sin \left( t \right)$ ，系统的初始状态为 $\left[ \pi /60, 0 \right]$ ，网络初始权值取随机值，宽度取2，中心取-2至2 。模糊神经网络控制器的输入为误差和误差变化率，输出为控制量。

仿真结果
角度跟踪效果

角度跟踪误差

仿真分析
根据仿真结果可得，角度跟踪效果良好，角度跟踪误差在1e-2数量级，较好的完成轨迹跟踪的目的，因此可得，模糊神经网络控制器设计成功。

4 总结

模糊神经网络控制器的仿真程序比较复杂，涉及到很多数学运算，尤其是矩阵运算以及各种函数求导，在编写代码的时候要特别注意矩阵的维度问题。
回想前两年学习的过程，我突然想到最开始我想用李雅普诺夫稳定性来更新神经网络权值，但最后始终有一个矩阵求偏导问题解决不了，而这次我用的梯度下降法来更新神经网络，各个矩阵求导公式也比较清晰，所以能够完成复现。
模糊神经网络仿真初见成效，也算是解决了历史遗留问题，心里舒服多了。

5 参考文献

[1] 周红标,张钰,柏小颖,等. 基于自适应模糊神经网络的非线性系统模型预测控制[J]. 化工学报,2020,71(7):3201-3212. DOI:10.11949/0438-1157.20191531.

[2] 陶征勇,童仲志,侯远龙,等. 基于模糊神经网络的破障武器PID控制[J]. 电光与控制,2020,27(9):99-104. DOI:10.3969/j.issn.1671-637X.2020.09.020.

[3] 张璐,张嘉成,韩红桂,等. 基于模糊神经网络的污水处理生化除磷过程控制[J]. 化工学报,2020,71(3):1217-1225. DOI:10.11949/0438-1157.20191514.

[4] 徐智浩,李胜,张瑞雷,等. 基于LuGre摩擦模型的机械臂模糊神经网络控制[J]. 控制与决策,2014(6):1097-1102. DOI:10.13195/j.kzyjc.2013.0510.

StopTheWorld丶

关注

2
点赞
踩
28

收藏

觉得还不错? 一键收藏
6
评论
【模糊神经网络】基于模糊神经网络的倒立摆轨迹跟踪控制

临近春节没啥事做，突然想起前两年未完成的模糊神经网络，当时是学了一段时间，但是到最后仿真始终不对，最后也不了了之了，趁最近有空，想重新回顾回顾，看看会不会产生新的想法。
复制链接

扫一扫

专栏目录