深度学习入门（三）——神经元激活值的计算方法

最新推荐文章于 2025-03-08 00:15:00 发布

爱骑单车的阿鹏

最新推荐文章于 2025-03-08 00:15:00 发布

阅读量7.1k

点赞数 2

文章标签：神经网络 python 人工智能深度学习

本文链接：https://blog.csdn.net/nikepaichang/article/details/116559115

版权

本文介绍了深度学习中神经元激活值的计算过程，包括加权求和、收缩函数（如Sigmoid）的应用以及偏置值的作用，阐述了隐含层用于特征提取的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

深度学习入门（三）——神经元激活值的计算方法

1.隐含层神经元的意义

介绍完全连接神经网络的基本结构和工作流程，可能会有人疑问了，神经元中存放的激活值是如何确定的？在解答这个问题之前，小编需要首先介绍神经网络的核心机制与网络中隐含层的意义。核心机制即每一层各神经元的激活值由上一层各神经元激活值经过加权、偏置、压缩等多次处理后得到。此核心机制正是模仿人脑中神经网络的工作机制：一些神经元的激发会促使另一些神经元激发。

整个数字识别功能也是依靠此核心机制实现，如果是已经训练好的神经网络模型，输入层784神经元的激活值经过神经网络模型计算得到第一层隐含层神经元的激活值，同理计算得到第二层隐含层神经元的激活值。接着，这一层神经元激活值经过计算产生了输出层10个神经元的激活值，这里输出的激活值就是已经训练好的模型认为输入图像与各个数字的相似度。激活值最大的神经元对应的数字就是该模型给出的识别结果。

那么为什么要搭建这么多层的神经元呢？直接用一个函数连接输入与输出不是更加简便吗？实际上，识别图像中的数字这个对我们来说再简单不过的任务对计算机来说却是相当的繁琐的。前几篇文章中提到，机器学习是通过学习算法提取出数据内在的规律完成特定任务。由此可见，中间隐含层存在的意义是将图像的特征表达出来。比如数字6的圈，数字1的长线段，这些都是本模型可能会提取出的数据特征。这些特征就是模型做出分类的判断依据。世界上很多识别工作都是像这样拆分成小块，再将对象一步步抽象成一个机器所认知的特征或规律。

2.神经元激活值的计算方法