神经网络的基础知识

最新推荐文章于 2024-06-17 21:34:22 发布

Komorebi S

最新推荐文章于 2024-06-17 21:34:22 发布

阅读量312

点赞数 1

文章标签：神经网络人工智能机器学习

本文链接：https://blog.csdn.net/weixin_50753425/article/details/131329895

版权

神经网络是机器学习中的一种模型，是一种模仿动物神经网络行为特征，进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度，通过调整内部大量节点之间相互连接的关系，从而达到处理信息的目的。其基本结构为：

其中，每个节点代表一个神经元。神经网络至少包括三层：输入层、隐藏层和输出层，每一层由不同数量的神经元组成。

1 神经元

神经元是神经网络中最基本的结构，其思想起源于生物学意义上的神经元。神经元模型是一个包含输入，输出与计算功能的模型。输入可以类比为神经元的树突，而输出可以类比为神经元的轴突，计算则可以类比为细胞核。神经元的输入向前传递获得输出的过程称为前馈。结构如图所示：

我们用a表示输入，w表示权重，y表示输出，g表示非线性函数sgn（现在通常使用的是Relu函数），则这个结构可以表示为：

y=g(a1*w1+a2*w2+a3*w3)

其真实意义是，我们已知一个样本的三个属性a1，a2，a3（特征），需要通过这三个属性预测一个未知属性y（标签），预测的过程就是这个神经元的公式。

实际应用中，我们一般将求和函数和非线性函数合并为一个整体，整个神经元模型在神经网络中表示为：

2 误差

我们使用误差值，也就是节点生成的答案与所知正确答案之间的差值，指导我们对权重w和偏差b进行调整。当神经网络进行训练时，通常会采用优化算法来最小化损失函数，以使神经网络的输出结果与真实结果之间的差异尽可能小。当神经网络进行训练时，其实就是通过不断地调整神经元之间的连接权重，以最大化训练集中样本的正确率。这个过程中常用的优化算法是反向传播算法。

反向传播的基本原理：先将神经网络给定的输入样本通过前向传播计算得到网络的输出结果，然后计算输出结果与真实结果之间的误差，并将误差反向传播到网络中去，计算每个神经元的误差贡献，并按照梯度下降法的原理更新网络中每个连接的权值和每个神经元的偏置值，从而不断迭代，找到能够最小化误差的神经网络模型。

具体来说，有以下步骤：①随即给定w和b，并给定损失函数L，利用前向传播获取神经网络输出结果；②用L计算网络输出值与真实值的误差，并反向传递回网络，计算每个神经元的误差梯度；③根据梯度下降原理，对w和b进行更新，使得输出与真实值逼近；④重复②和③，直到误差达到阈值或训练次数达到某个阈值。

常见的损失函数包括均方误差（Mean Squared Error, MSE）、交叉熵（Cross Entropy）等。MSE是回归问题中的常用损失函数，而交叉熵则是分类问题中的常用损失函数。以均方误差为例：