3.4神经网络学习规则

最新推荐文章于 2022-08-20 06:28:26 发布

分数不是数

最新推荐文章于 2022-08-20 06:28:26 发布

阅读量4.3k

点赞数 1

分类专栏：人工智能学习笔记

本文链接：https://blog.csdn.net/qq_17517409/article/details/106027837

版权

人工智能学习笔记专栏收录该内容

18 篇文章 4 订阅

订阅专栏

神经网络学习规则

关于学习的定义
学习规则的类型
赫布法则
赫布学习规则
离散感知器学习规则
连续感知器学习规则：δ规则
最小均方学习规则
相关学习规则
外星学习规则

关于学习的定义

学习是指通过训练使个体在行为上产生较为持久改变的过程，一般来说效果随着训练的增加而提高，即通过学习获得进步。

人工神经网络的功能由其连接的拓扑结构和网络的连接权值决定，其全体的权值 W 整体反映了神经网络对于所解决问题的知识存储。即一旦拓扑结构和权值确定，该网络就可以应用于新的数据得到结果。

人工神经网络的学习就是通过对样本的学习训练，不断改变网络的拓扑结构及连接权值，使得输出不断的接近期望输出值。

通过训练改变权值的规则被称为学习算法或者学习规则，有时也称作训练规则或者训练算法，学习规则对人工神经网络非常重要。

学习规则的类型

按照一般的分类标准通常分为三类：

有监督学习：学习模式为纠错
不断的给网络提供一个输入，即其期望的正确输出（称教师信号），将ANN的实际输出和期望输出作比较，不符时，按照一定规则调整权值参数，重新计算、比较，直到网络对于给定的输入均能产生期望的输出，则认为该网络训练完成，即已学会样本数据中的知识和规则。即可用于解决实际问题。
无监督学习：学习模式为自组织
学习时不管给网络提供动态输入信息，网络根据特有的内部结构和学习规则，在输入信息流中发现可能的模式和规律，同时根据网络功能和输入信息调整权值（自组织）。使网络能对属于同一类的模式进行自动分类。该模式网络权值的调整不取决于教师信号，网络的学习评价标准隐含于网络内部。
灌输式学习：学习模式为死记硬背
将网络设计成记忆特别的例子，当输入为该例子时，网络可以回忆起该例子。网络权值非训练得到，而是通过某种设计方法得到，权值一旦设计好，即一次性灌输给网络，不再变动。

赫布法则

唐纳德·赫布（Donald Olding Hebb）在《The Organization of Behavior》书中解释了学习过程中大脑中的神经细胞是如何改变和调整的，他认为知识和学习发生在大脑，主要是通过神经元间突触的形成与变化。当细胞A的轴突足以接近以激发细胞B，并反复持续地对细胞B放电，一些生长过程或代谢变化将发生在某一个或这两个细胞内，以致A作为对B放电的细胞中的一个效率增加。

通俗来讲就是两个神经细胞交流越多，它们连接的效率就越高，反之就越低。

M-P模型缺乏一个对人工智能而言至关重要的学习机制，M-P模型很好的简化、模拟了神经元，但是无法通过学习的方式调整、优化权重，形成有效的模型。赫布法则的出现，成为神经模型的训练（学习机制）的基础性工作。

赫布规则通常用作无监督神经网络的学习，常应用于自组织神经网络、竞争网络中。

赫布学习规则

赫布学习规则为前馈、无导师学习。只根据实际输入和输出调整权重。
在赫布学习规则中，学习信号简单的等于神经元的输出： $r=f(W_j^TX)$
权值向量的调整公式为： $W_j=ηf(W_j^TX)X，η为常数$
权向量各个分量调整为： $w_{ij}=ηf(W_j^TX)x_i=ηo_jx_i，i=0,1,...,n$
赫布学习规则的步骤：

初始化权值参数W，一般赋于0附近的随机数
初始化学习率η
对所有输入记录：
根据输入记录，更新权重值

例：设阈值为 $T = 0$ ，学习速率 $η = 1$ ，初始权值 $W^{(0)}=(1,-1,0,0.5)^T$ ，输入样本有 $X^{(1)}=(1,-2,1.5,0)^T,X^{(2)}=(1,-0.5,-2,-1.5)^T,X^{(3)}=(0,1,-1,1.5)^T$ ，激活函数 $f (x) = s g n (x)$ ，使用赫布规则训练网络
赫布学习规则例子
代入第一个样本 $X^{(1)}$ ，计算 $net_1^{(1)}$ ：
$net^{(1)}_1=(W^{(0)})^TX^{(1)}=\begin{pmatrix}1 & -1 & 0 & 0.5\end{pmatrix}\begin{pmatrix}1\\-2\\1.5\\0\end{pmatrix}=3$
根据第一个样本 $X^{(1)}$ ，更新 $W^{(0)}$ ：
$W^{(1)}=W^{(0)}+ηf\Big((W^{(0)}_1)^TX^{(1)}\Big)X^{(1)}\\\quad\quad=W^{(0)}+η*sgn(net^{(1)}_1)*X^{(1)}\\\quad\quad=\begin{pmatrix}1\\-1\\0\\0.5\end{pmatrix}+1*1*\begin{pmatrix}1\\-2\\1.5\\0\end{pmatrix}=\begin{pmatrix}2\\-3\\1.5\\0.5\end{pmatrix}$
代入第二个样本 $X^{(2)}$ ，计算 $net_1^{(2)}$ ：
$net_1^{(2)}=(W^{(1)})^TX^{(2)}\\\quad\quad =\begin{pmatrix}2 & -3 & 1.5 & 0.5\end{pmatrix}\begin{pmatrix}1\\-0.5\\-2\\-1.5\end{pmatrix}=-0.25$
根据第二个样本 $X^{(2)}$ ，更新 $W^{(1)}$ ：
$W^{(2)}=W^{(1)}+ηf(W^T_1X^{(2)})X^{(2)}\\\quad\quad=W^{(1)}+η*sgn(net^{(2)}_1)*X^{(2)}\\\quad\quad=\begin{pmatrix}2\\-3\\1.5\\0.5\end{pmatrix}+1*(-1)*\begin{pmatrix}1\\-0.5\\-2\\-1.5\end{pmatrix}=\begin{pmatrix}1\\-2.5\\3.5\\2\end{pmatrix}$
代入第三个样本 $X^{(3)}$ ，计算 $net_1^{(3)}$ ：
$net_1^{(3)}=(W^{(2)})^TX^{(3)}\\\quad\quad =\begin{pmatrix}1 & -2.5 & 3.5 & 2\end{pmatrix}\begin{pmatrix}0\\1\\-1\\1.5\end{pmatrix}=-3$
根据第三个样本 $X^{(3)}$ ，更新 $W^{(2)}$ ：
$W^{(3)}=W^{(2)}+ηf(W^T_2X^{(3)})X^{(3)}\\\quad\quad=W^{(2)}+η*sgn(net^{(3)}_1)*X^{(3)}\\\quad\quad=\begin{pmatrix}1\\-2.5\\3.5\\2\end{pmatrix}+1*(-1)*\begin{pmatrix}0\\1\\-1\\1.5\end{pmatrix}=\begin{pmatrix}1\\-3.5\\4.5\\0.5\end{pmatrix}$

离散感知器学习规则

感知器（Perceptron）是由Rosenblatt定义的具有单层神经计算单元的神经网络结构。实际上为一种前馈网络，同层内无互连，不同层间无反馈，由下层向上层传递，其输入、输出均为离散值，神经元对输入加权求和后，由阈值函数（激活函数）决定其输出。

离散感知器学习规则则代表一种有导师的学习方式，其规定将神经元期望输出（教师信号）与实际输出之差作为学习信号，通过训练调整权值直到实际输出满足要求（等于或者接近于期望输出）。

在该学习规则中，学习信号等于神经元的期望输出与实际输出之差：
在这里插入图片描述
权值调整公式为：

权向量各个分量调整为：

离散感知器学习规则的步骤：

初始化权值参数W，学习速率η
对每一个样本，实际输出和期望输出的差是否满足要求：
- 根据输入记录，更新权重值

例子：
在这里插入图片描述

连续感知器学习规则：δ规则

Delta学习规则（δ Learning Rule）：1986年，由认知心理学家McClelland和Rumellhart在神经网络训练中引入了学习规则。一种简单的有导师学习算法，该算法根据神经元的实际输出与期望输出差别来调整连接权。
Delta学习规则的思路如下：系统首先用一个输入向量，输入网络结构，得到一个输出向量；每个输入向量都有一个对应的期望输出向量、或者称作是目标向量；比较实际输出向量与期望输出向量的差别，若没有差别，就不再继续学习；否则，连接的权重修改对应的差值（delta差）。

在这里插入图片描述

梯度（Gradient）：是一个向量，表示某一函数在该点处的方向导数沿着该方向取得最大值，即函数在该点处沿着该方向变化最快，变化率最大。
梯度下降法（GradientDescent）：一种最优化算法，也称为最速下降法。沿着负梯度方向去减小函数值从而接近目标值。
在这里插入图片描述

在这里插入图片描述

确定了损失函数，就需要对损失函数进行优化，求最小值，以平方损失函数（QuadraticLF）为例：
在这里插入图片描述
求 L 的梯度：

假设激活函数选用了sigmoid函数：
在这里插入图片描述

求出此时 L 的梯度：
在这里插入图片描述

δ规则的学习信号为：
在这里插入图片描述
δ规则的推导：由输出值与期望输出值的最小二次方误差条件，推导δ规则
输出值与期望输出值的二次方误差为：

学习的目的就是为了让实际输出值与期望输出值的差最小，即求使 E 最小的权值 W 。根据之前的损失函数和梯度、梯度下降法可以知道，W 沿着梯度的负方向（最小值）按照步长η（学习速率）变化，会快速逼近最小值，即有：
在这里插入图片描述

最小均方学习规则

1962年Bernard Widrow和Marcian Hoff提出了Widrow-Hoff学习规则，它可以使神经元实际输出和期望输出之间的二次方的差最小，所以又称为最小均方学习规则（Least-Mean-Square，LMS）。
LMS规则的学习信号为：
在这里插入图片描述
权向量调整量为：

权值分量调整为：

最小均方算法是δ学习规则的特例，其激活数不同于δ学习规则，不做任何变换：

最小均方算法和δ学习规则相比，无需求导数，学习速度快，且有不错的精度

外星学习规则

内星节点：总是接收其他神经元输入的加权信号，是信号的汇聚点，其对应的权值向量称作内星权向量。
外星节点：总是向其他神经元输出加权信号，是信号的发散点，其对应的权值向量称作外星权向量。

内星学习规则：内星节点的输出响应是输入X和内星权向量W的点积，描述了输入与权向量的相似程度，其更新规则类似于胜者为王：△Wj=α(Xi-Wj)
外星学习规则：属于有导师学习，其目的是为了生成一个期望的m维输出向量d，外星权向量Wj更新通过两者的差异实现，
其规则为：△Wj=η(d-Wj)
在这里插入图片描述
两者的更新规则：
内星属于无导师学习，外星属于有导师学习
内星更新依赖于输入和权重的差异，外星更新依赖于输出和权重的差异

分数不是数

关注

1
点赞
踩
19

收藏

觉得还不错? 一键收藏
打赏
0
评论
3.4神经网络学习规则

神经网络学习规则关于学习的定义学习规则的类型赫布法则赫布学习规则离散感知器学习规则连续感知器学习规则：δ规则最小均方学习规则外星学习规则关于学习的定义学习是指通过训练使个体在行为上产生较为持久改变的过程，一般来说效果随着训练的增加而提高，即通过学习获得进步。人工神经网络的功能由其连接的拓扑结构和网络的连接权值决定，其全体的权值 W 整体反映了神经网络对于所解决问题的知识存储。即一旦拓扑结构和权值确定，该网络就可以应用于新的数据得到结果。人工神经网络的学习就是通过对样本的学习训练，不断改变网络的拓扑结
复制链接

扫一扫