推理计算过程_人工神经网络的泛化性和正向网络推理

最新推荐文章于 2022-11-15 21:45:54 发布

余木脑袋

最新推荐文章于 2022-11-15 21:45:54 发布

阅读量814

点赞数

文章标签：推理计算过程

本文链接：https://blog.csdn.net/weixin_42104778/article/details/112712356

版权

本文探讨了神经网络的泛化能力，即模型对未见过数据的预测准确性。训练样本质量、数量，网络结构和问题复杂度是影响泛化能力的关键因素。正向网络推理步骤包括输入数据、逐层计算和输出判定，其特点是并行处理和自适应推理，且避免了传统推理的冲突问题。

摘要由CSDN通过智能技术生成

基于神经网络的知识推理实质上是在一个已经训练成熟的网络基础上对未知样本进行反应或者判断。神经网络的训练是一个网络对训练样本内在规律的学习过程，而对网络进行训练的目的主要是为了让网络模型对训练样本以外的数据具有正确的映射能力通常定义神经网络的泛化能力，也称推广能力，是指神经网络在训练完成之后输入其训练样本以外的新数据时获得正确输出的能力。它是人工神经网络的一个属性，称为泛化性能。

不管是什么类型的网络，不管它用于分类、通近、推理还是其他问题，都存在一个泛化的问题。泛化特性在人工神经网络的应用过程中表现出来，但由网络的设计和建模过程所决定。从本质上来说，不管是内插泛化还是外推泛化，泛化特性的好坏取决于人工神经网络是否从训练样本中找到内部的真正规律。

影响泛化能力的因素主要有：

①训练样本的质量和数量。

②网络结构。

③问题本身的复杂程度。

下图是一个简单的曲线拟合实验，图中实线部分表示理想曲线，“十”表示训练样本数据。(a)、(b)、(c)、(d)分别表示训练100、200、300、400次后，神经网络根据输入的样本数据进行曲线拟合的效果。

曲线拟合实验

神经网络的训练次数也称为神经网络的学习时间，由试验结果可以看出，在一定范围内，训练次数的增加可以提高神经网络的泛化能力。然而，在神经网络的训练过程中经常出现一种过拟合现象，即在网络训练过程中，随着网络训练次数的增加，网络对训练样本的误差逐渐减小，并很容易达到中止训练的最小误差的要求，从而停止训练。

然而，在训练样本的误差逐渐减小并达到某个定值以后，往往会出现网络对训练样本以外的测试样本的误差反而开始增加的情况。对网络的训练，并不是使训练误差越小越好，而是要从实际出发，提高对训练样本以外数据的映射能力，即泛化性能。

神经网络的泛化性能还体现在网络对噪声应具有一定的抗干扰能力上。过多的训练无疑会增加神经网络的训练时间，但更重要的是会导致神经网络拟合数据中噪声信号的过学习(over learning)，从而影响神经网络的泛化能力。学习和泛化的评价基准不一样是过学习产生的原因。Reed等人对单隐含层神经网络训练的动态过程进行分析后发现，泛化过程可分为三个阶段：

第一阶段，泛化误差单调下降；

第二阶段的泛化动态较为复杂，但在这一阶段，泛化误差将达到最小点；

第三阶段，泛化误差又将单调上升。

最佳的泛化能力往往出现在训练误差的全局最小点出现之前，最佳泛化点出现存在一定的时间范围。理论上可以证明在神经网络训练过程中，存在最优的停止时间。