神经元的变换函数
从净输入到输出的变换函数称为神经元的变换函数,即
- 阈值型变换函数
比如符号函数 - 非线性变换函数
比如单极性Sigmoid函数
又比如双极性S型(又曲正切)函数 - 分段性变换函数
比如 - 概率型变换函数
这时输入与输出之间的关系是不确定的,需要用一个随机函数来描述输出状态为1或为0的概率。设输出为1的概率为T为温度参数,这种神经元模型也称为热力学模型。
学习规则
改变权值的规则称为学习规则或学习算法。
学习规则 | 权值调整 | 权值初始化 | 学习方式 | 变换函数 | |
向量式 | 元素式 | ||||
Hebbian | 0附近的小随机数 | 无导师 | 任意 | ||
离散Percrptron | 任意 | 有导师 | 二进制 | ||
连续感知器δ规则 | 任意 | 有导师 | 连续 | ||
最小均方LMS(Widrow-Hoff规则) | 任意 | 有导师 | 任意 | ||
相关Correlation | 0 | 有导师 | 任意 | ||
胜者为王 Winner-take-all | 随机,归一化 | 无导师 | 连续 | ||
外星Outstar |
| 0 | 有导师 | 连续 |
Hebb学习规则指出:当神经元的突触前膜电位与突触后膜电位同时为正时,突触传导增强;电位相反时,突触传导减弱。应预先设置权值饱和值,防止输入和输出正负始终一致时出现权值无约束增长。
η是学习率。
在离散感知器学习规则中,期望输出dj和实际输出sgn(WjTX)取值都是-1和1。这种感知器仅适合于二进制神经元。
连续感知器δ规则要求变换函数是可导的,因此只能用于有导师学习中定义的连续变换函数,如Sigmoid函数。实际上δ规则是由输出与期望的最小平方误差推导出来的。
最小均方学习规则实际上是δ规则的特例--在δ规则中令。最小均方学习规则与变换函数无关,不需要对变换函数求导,不仅学习速度快,而且具有较高的精度。它能使实际输出与期望输出之间的平均方差最小(什么意思?why?)。
胜者为王规则中有一个竞争层,对于特定的输入,竞争层的每个神经元均有输出响应,其中响应最大的神经元j*成为获胜神经元,只有获胜神经元才有权调整其权值向量。学习率应该随着学习的进展而减小。
外星学习规则使权向量向期望输出靠拢。
单层感知器
单层感知器只有输入层和输出层,它仅对线性可分问题具有分类能力,在实际中很少使用。
多层感知器
隐藏层的加入使感知器能够解决非线性的分类问题,并且双隐藏层感知器足以解决任何复杂的分类问题。
当变换函数从线性函数变为非线性函数时,分类边界的基本元素从直线变为曲线,这样整个分类边界线变成连续光滑的曲线,从而提高感知器的分类能力。
对于各隐藏层节点来说,不存在期望输出,因而学习规则对隐藏层权值不适用。
自适应线性单元(Adaptive Linear Neuron)
使用最小均方学习规则LMS(Least Mean Square),即最小二乘法。