径向基RBF(radial basis function)函数、RBF神经网络、反推(back-stepping)控制

Zhao-Jichao

已于 2022-10-16 17:48:26 修改

阅读量2.6k

点赞数 3

文章标签：神经网络深度学习机器学习

于 2021-04-26 22:44:59 首次发布

本文链接：https://blog.csdn.net/weixin_36815313/article/details/116176193

版权

	径向基
1	径向基RBF(radial basis function)函数、RBF神经网络、反推(back-stepping)控制
2	基于 RBF 径向基神经网络的自适应控制，原理推导，效果实现，Matlab 程序
3	使用 RBF神经网络，结合参考模型，通过神经网络输出被控模型的控制器，实现其对参考模型的跟踪，Matlab 程序

1. 什么是径向基函数

理解RBF网络的工作原理可从两种不同的观点出发：

当用RBF网络解决非线性映射问题时，用函数逼近与内插的观点来解释，对于其中存在的不适定(illposed）问题，可用正则化理论来解决；
当用RBF网络解决复杂的模式分类任务时，用模式可分性观点来理解比较方便，其潜在合理性基于Cover关于模式可分的定理。

下面阐述基于函数逼近与内插观点的工作原理。

1963年Davis提出高维空间的多变量插值理论。径向基函数技术则是20世纪80年代后期，Powell在解决“多变量有限点严格（精确）插值问题”时引人的，目前径向基函数已成为数值分析研究中的一个重要领域。

考虑一个由 $N$ 维输人空间到一维输出空间的映射。设 $N$ 维空间有 $p$ 个输入向量， $p=1,2,\cdots,P$ ，它们在输出空间相应的目标值为 $d^p,~p=1,2,...,P$ ， $P$ 对输人一输出样本构成了训练样本集。插值的目的是寻找一个非线性映射函数 $F (X)$ ，使其满足下述插值条件：

$d^p,~~~~p=1,2,\cdots,P \tag{1}$

式子中，函数 $F$ 描述了一个插值曲面，所谓严格插值或精确插值，是一种完全内插，即该插值曲面必须通过所有训练数据点。

那么到底什么是插值，在这里简单的解释一下，就是通过训练集数据，我找到一个曲面，这个曲面可以完全覆盖这些训练点，那么找到这个曲面后就可以通过这个曲面取寻找其他的值了，下面画个图给大家看看：

在这里插入图片描述

就是我通过一些数据样本点，每个样本都有目标值，通映射高维空间去找到一个曲面 $F (x)$ ,这个曲面需要经过所有的数据，一旦这个曲面确定以后，我就可以通过这个曲面去生成更多的数据目标值，就是这个意思了，好，我们继续往下：

采用径向基函数技术解决插值问题的方法是，选择 $P$ 个基函数个训练数据，各基函数的形式为：

$\varphi(\|x-x^p\|),~~~p=1,2,\cdots,P \tag{2}$

式中，基函数 $\varphi$ 为非线性函数，训练数据点 $x^P$ 是 $\varphi$ 的中心。

基函数以输入空间的点 $x$ 与中心 $x^P$ 的距离作为函数的自变量。由于距离是径向同性的，故函数被称为径向基函数。

基于径向基函数技术的插值函数定义为基函数的线性组合：
$\sum_{p=1}^{P} w_p \varphi(\|x-x^P\|) \tag{3}$

在这里解释一下 $x-x^P\|$ ，这是范数。对平面几何的向量来说就是模，然而一旦维度很高就不知道是什么东西了，可能是衡量距离的一个东西，那么这个代表什么意思呢？简单来说就是一个圆而已，在二维平面， $x^P$ 就是圆心， $x$ 就是数据了，这个数据距离圆心的距离，因为和数据的位置和大小无关，只和到圆心的半径有关，况且同一半径圆上的点到圆心是相等的因此取名为径向，代入映射函数就是径向基函数了，我们看看径向基函数有什么特点：

将 (1) 式的插值条件代入上式，得到 $P$ 个关于未知系数 $w^p, p=1,2,\cdots,P$ 的线性方程组：
$\begin{aligned} \sum_{p=1}^{P} w_p \varphi(\|x^1 - x^p\|) &= d^1 \\ \sum_{ p=1}^{P} w_p \varphi(\|x^2 - x^p\|) &= d^2 \\ &\vdots \\ \sum_{p=1}^{P} w_p \varphi(\|x^P - x^p\|) &= d^P \\ \end{aligned}$

令 $\varphi_{ip}=\varphi(\|x^i - x^p\|)$ ， $i=1,2,\cdots,P$ ， $p=1,2,\cdots,P$ ，则上述方程组可改写为：
$\left[\begin{matrix} \varphi_{11} & \varphi_{12} & \cdots & \varphi_{1P} \\ \varphi_{11} & \varphi_{12} & \cdots & \varphi_{1P} \\ \vdots & \vdots & \ddots & \vdots \\ \varphi_{11} & \varphi_{12} & \cdots & \varphi_{1P} \\ \end{matrix}\right] \left[\begin{matrix} w_1 \\ w_2 \\ \vdots \\ w_P \\ \end{matrix}\right]= \left[\begin{matrix} d_1 \\ d_2 \\ \vdots \\ d_P \\ \end{matrix}\right]\tag{5}$

令 $\Phi$ 表示元素 $\varphi_{ip}$ 的 $P\times P$ 阶矩阵， $W$ 和 $d$ 分别表示系数向量和期望输出向量，(5) 式还可以写成下面的向量形式：

$\Phi W = d \tag{6}$

式中， $\Phi$ 称为插值矩阵，若 $\Phi$ 为可逆矩阵，就可以从 (6) 式中解出系数向量 $W$ ，即：
$\Phi^{-1}d \tag{7}$

通过上面大家可以看到为了使所有数据都在曲面还需要系数调节，此时求出系数向量就求出了整个的映射函数了，下面看几个特殊的映射函数：

1.1 高斯径向基函数

$\varphi(r) = \exp(-\frac{r^2}{2\delta^2})$

在这里插入图片描述

横轴就是到中心的距离，用半径 $r$ 表示。如上图，我们发现当距离等于 0 时，径向基函数等于 1，距离越远衰减越快，其中高斯径向基的参数 $\delta$ 在支持向量机中被称为到达率或者说函数跌落到零的速度。

红色 $\delta=1$ ，蓝色 $\delta=5$ ，绿色 $\delta=0.5$ ，我们发现到达率越小其越窄。

1.2 反演S型函数

1.3 拟多二次函数

2. 正则化径向基神经网络

正则化RBF网络的结构如下图所示。其特点是：网络具有 $N$ 个输人节点， $P$ 个隐节点， $i$ 个输出节点；网络的隐节点数等于输人样本数，隐节点的激活函数常高斯径向基函数，并将所有输人样本设为径向基函数的中心，各径向基函数取统一的扩展常数。

在这里插入图片描述

设输入层的任意节点你用 $i$ 表示，隐节点任意节点用 $j$ 表示，输出层的任一节点用 $k$ 表示。对各层的数学描述如下：

输入向量：
$(x_1, x_2, \cdots, x_N)^T$

任一隐节点的激活函数：
$\varphi_j(X),~~~~(j=1,2,\cdots,P)$

称为基函数，一般使用高斯函数。

输出权矩阵：
$W$

其中， $w_{ik},(j=1,2,\cdots,P, k=1,2,\cdots,l)$ 为隐层的第 $j$ 个节点与输出层第 $k$ 个节点间的突触权值。

输出向量：
$(y_1, y_2, \cdots, y_l)$

输出层神经元采用线性激活函数。

当输入训练集中的某个样本 $x^p$ 时，对应的期望输出 $d^p$ 就是教师信号。为了确定网络隐层到输出层之间的 $P$ 个权值，需要将训练集中的样本逐一输入一遍，从而得到式 (4) 中的方程组。网络的权值确定后，对训练集的样本实现了完全内插，即对所有样本误差为 0。而对非训练集的输入模式，网络的输出值相当于函数的内插，因此径向基函数网络可用作数逼近。