径向基函数神经网络的基本原理和特点
石显:土石坝参数反演的蚁群聚类RBF网络模型——RBF网的学习算法zhuanlan.zhihu.com1 RBF网络的结构和工作原理
与多层感知器(BP网络)不同,RBF网的最显著特点是隐节点的基函数采用距离函数(如欧氏距离),并使用径向基函数作为激活函数。径向基函数关于n维空间的一个中心点具有径向对称性,而且神经元的输入离该中心越远,神经元的激活程度就越低。隐节点的这个特性常被称为“局部特性”。
2 RBF网络的生物学基础
RBF网的隐节点的局部特性主要是模仿了某些生物神经元的“近兴奋远抑制”功能,灵长类动物的视觉系统中就有这样的神经元。从视觉感受野可以做出完善的分析。中枢神经元的感受野是指能影响某一视神经元反应的视网膜或视野的区域。可通过电生理学试验记录感受野的形状。电光学试验可理解为有一根极小的电极置于某个细胞内的特定欲记录电位的区域,这样,当光束照到视网膜上,如果该细胞被激活,通过这个区域的电脉冲就增加;反之,如果该细胞被抑制,通过这个区域的电脉冲就减少。静止的细胞膜电位约70mV,因此可以用示波器观察到这些脉冲。
每个视皮层,外侧膝状体的神经元或视网膜神经细胞节细胞在视网膜上均有其特定的感受野。侧膝核和节细胞的感受野非常相似,都呈圆形,并具有近兴奋远抑(on-enterOff-surround)或远兴奋近抑制(off-center on-surround)功能。如图4.2所示。
3 RBF网络的数学基础
1985年,PoweU提出了多变量插值的径向基函数方法。假定共有l个学习样本,其输入为:s={x1,x2,…,xl},相应的样本输出,即教师信号(单输出)为t={y1,y2,…,yl}所谓的多变量内插问题是指寻找函数,使之满足以下的内插条件:
Yi=F(xi) (4.3)
共=F(戈)(4.3)
这是一个经典的数学问题,可以有多种解决方案,采用叨F网络也可以解决该问题。RBF网解决内插问题时,一种方案是使用l个隐节点,并把所有的样本输入选为RBF网的数据中心,且各基函数取相同的扩展常数。于是RBF网从输入层到输出层的输出便是确定的。
事实上,如果隐节点激活函数采用径向基函数,且x1,x2,…,xl各不相同,则隐节点输出阵H的可逆性是可以保证的。因此,如果把全部样本输入作为RBF网的数据中心,网络在样本输入点的输出就等于教师信号,此时网络对样本实现了完全内插,即对所有样本误差为0。
4 RBF网络与多层感知器的比较
多层感知器伽LP)通常指的是BP网络。RBF网与BP网,都是非线性的层状前馈网络。它们都是通用的逼近器,都以实现非线性映射为主要功能,但二者有以下区别。
(1)对生物系统的模拟。BP网隐单元一般采用sigmoid函数,网络特性主要由权值变化表征。RBF网隐单元一般采用径向基函数,但有不同的中心和宽度,对输入的反应有不同的兴奋程度,能在更高层次上实现对生物神经系统的模拟。
(2)网络结构与表达能力。形式上两种网络的结构相同,均为多层前馈网络,由于BP网的网络特性主要通过权值表征,使其较难实现训练目标,往往需要增多单元及隐层。一个RBF网只具有一个隐含层,而一个BP网可以有一个或多个隐含层,对于层数相同的RBF网和BP网,前者的表达能力往往强于后者。
(3)训练算法。BP网采用误差反向传播算法,经典的常为梯度算法,虽有较多改进,大多收敛速度较慢,且易于限于局部最小。而RBF网的训练算法,可以分为两段,各自都能快速完成,无BP网络训练算法的缺点。
(4)逼近方式。神经网络逼近函数一般有两种方式:全局逼近与局部逼近。对于任一学习样本,为满足精度要求,需修改网络所有连接权与可调参数,此为全局逼近,其学习速度缓慢,泛化性能较难调整,BP网是全局逼近的典型实例。对于输入空间某局部区域的样本,只需调整少量参数值即能够满足精度要求,此为局部逼近,其学习速度快,泛化性能好,RBF网是一种典型的局部逼近网络。
《来源科技文献,经本人分析整理,以技术会友,广交天下朋友》