深度学习笔记二：多层感知机（MLP）与神经网络结构

最新推荐文章于 2025-05-08 21:39:31 发布

谢小小XH

最新推荐文章于 2025-05-08 21:39:31 发布

阅读量9.1w

点赞数 38

分类专栏：深度学习理论文章标签：神经网络深度学习

本文链接：https://blog.csdn.net/xierhacker/article/details/53282038

版权

本文介绍了神经网络的基本结构，包括输入层、隐藏层和输出层，强调了前向传播的过程，并以手写体识别为例进行说明。讨论了激活函数的重要性，特别是sigmoid函数在神经网络中的作用，以及它与logistic回归的关系。文章还简述了神经网络的训练，使用随机梯度下降法最小化损失函数，为后续的反向传播打下基础。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

为了尽量能形成系统的体系，作为最基本的入门的知识，请参考一下之前的两篇博客：
神经网络(一):概念
 神经网络(二):感知机
上面的两篇博客让你形成对于神经网络最感性的理解。有些看不懂的直接忽略就行，最基本的符号的记法应该要会。后面会用到一这两篇博客中的一些记号和用法的约定什么的之后就不再啰嗦了。

一.基本结构

看完上面给出的两个博客或者已经有基本概念的同学应该对于神经网络的基本结构有基本的认识了。但是上面那个还只是涉及到单层结构，并没有推广到多层结构，同时，也没有在实践中使用这种结构的经验。所以，这节的内容就是以手写体识别为例子来讲一下基本结构，和实践中的基本使用思想。这是推广到更加复杂任务上的基础。
假设你现在已经有了神经网络的一些感性认识了，那就就看下面这幅图。
这里写图片描述
输入层（最左边），隐藏层（中间两层），和输出层（最右边），在之前列出的博客就讲过了，这里回顾一下。感受一下大概的架构。
神经网络的流程分为前向过程和反向过程。反向过程一般用于训练，后面讲，这里只讲前向过程。
还记得每个神经元上面都有对于一个输入的权值，以及一个偏置，还有一个激活函数。（不知道的话看之前列出来的博客，后面不再强调了

最低0.47元/天解锁文章