好吃的西瓜-第五章

最新推荐文章于 2024-07-25 21:10:30 发布

Tonyapple99

最新推荐文章于 2024-07-25 21:10:30 发布

阅读量60

点赞数

文章标签：机器学习算法深度学习

本文链接：https://blog.csdn.net/Tonyapple99/article/details/129234281

版权

1. 神经元模型

神经网络是由具有适应性的简单单元组成的广泛并行互联的网络，它的组织能够模拟生物神经系统对真实世界物体所做出的交互反应。
神经元模型：是神经网络最基本的成分。当通过神经元的信息信好超过某一个阈值，那么该神经元就会激活，从而作用于下一个神经元。
M-P神经元模型：神经元连接来自收到来自n个其他神经元传递来的输入信号，与权重结合进行传递。神经元将收到的总输入值与阈值进行比较，利用激活函数（e.g Sigmoid）处理后产生输出。
激活函数：最典型的激活函数是阶跃函数，类似分段函数，0表示非兴奋状态，1表示兴奋状态。但阶跃函数不连续、不光滑，无法表达所有数据的活跃性质，因此常常使用sigmoid函数来对数据进行处理。从而把较大范围内变化的输入值挤压到(0, 1)输出值范围内。

2. 感知机与多层网络

感知机：由两层神经元组成——输入层和输出层。输入层接受外界信好后传递给输出层，输出层是M-P神经元（阈值逻辑单元）。权重wi和阈值θ可通过学习得到。

感知机只有输出层一层可以进行激活函数处理，学习能力有限，即只能一刀切。对于线性不可分问题或非线性问题，通常采用多层神经元。

多层神经网络：输入层和输出层间有隐含层（隐层），隐层和输出层神经元都拥有激活函数，从而将一刀切问题转化为了平面划分问题。

多层前馈神经网络：每层神经元与下一层神经元实现全连接，不存在同层连接和跨层连接。所谓的前馈，并非指信号不能向后传递，而是指网络拓扑结构上不存在环路或回路。隐层的作用在于对上一层神经元的输出结果进行信号加工，最终产生结果由输出层神经元输出。换言之，输入层神经元只负责接受数据，而隐层和输出层包涵功能神经元，对数据进行函数处理。（只包含一个隐层的三层神经网络即可称为多层神经网络）。

神经网络的学习过程，就是根据训练数据来调整神经元之间的连接权值和功能神经元的阈值。因此权值和阈值是神经网络的关键。

【*注】阈值相当于神经元内部的关键参数，而权值相当于不同神经元与不同神经元之间相连关系的重要度。

3. 误差逆传播算法（反向传播算法-BP）

当网络层级较多时，产生的权值和阈值就会有许多，而调整阈值和权值的方法，就称作反向传播算法。如果说前馈神经网络的目的是为了得到最合适的预测模型，那么反向传播算法的作用就是反向求解，为了得到最合适的权值和阈值。
BP算法基于梯度下降策略，以目标的负梯度方向对参数进行调整。即对均方误差求解函数，分别对θ、w、λ等进行求导。

【*注】面对庞大的数据计算量时，往往先采用累计误差逆传播方法对参数进行范围上的先处理，当累计误差下降到一定程度后，改用标准BP算法对部分参数进行优化。这样的方式更加合理。

BP神经网络易造成过拟合，因此常用①早停和②正则化两种方式来避免。

早停：将数据集划分成训练集和验证集，其中训练集用来计算梯度、更新连接权和阈值，而验证集则用来估计误差。若训练集误差降低，而验证集误差提升则停止训练，返回最小验证集误差对应的连接权和阈值。

正则化：在误差目标函数中增加一个用于描述网络复杂度的部分