全连接神经网络基础——正向传播及损失函数

最新推荐文章于 2023-03-28 14:53:14 发布

Ashe616

最新推荐文章于 2023-03-28 14:53:14 发布

阅读量2k

点赞数 2

分类专栏：深度学习笔记文章标签：神经网络深度学习

本文链接：https://blog.csdn.net/qq_45792899/article/details/112334049

版权

本文介绍了全连接神经网络的基础知识，包括网络结构、正向传播原理，以及针对回归和分类问题的损失函数。通过实例详细阐述了均方误差（MSE）和交叉熵损失函数的应用，并提供了相关代码验证。

摘要由CSDN通过智能技术生成

全连接神经网络结构

顾名思义，全连接神经网络指的是上一层网络中的所有神经元都与下一层网络中的所有神经元相连，即上一层网络所有神经元的输出都作为下一层网络所有神经元的输入。一个简单的全连接神经网络结果如下，
在这里插入图片描述

该网络除去输入层以及输出层外有两层隐藏层，每个隐藏层有三个神经元，每层神经元都与下层神经元进行全连接。

正向传播

在网络的正向传播过程中，每个神经元首先将上层网络神经元的输出进行一个线性组合，然后通过一个非线性函数进行非线性变换作为当前神经元的输出。神经元的结构如下图所示，
在这里插入图片描述

上层神经元产生的输出 $x_1, x_2, x_3$ 作为输入传入当前神经元，首先在权重 $w_1, w_2, w_3$ 和一个偏置项 $b$ 的作用下进行线性组合，然后通过非线性函数 $f$ 进行非线性变换产生输出 $y$ ，即
$y = f(w_1x_1 + w_2x_2 + w_3x_3+b)。$

激活函数的作用是为了让网络能够解决非线性问题，如果没有激活函数，整个网络可以视为一个简单的线性函数，然而现实中的问题大多数是非线性的，所以通过引入激活函数来表达非线性模型。常见的激活函数有
${\rm sigmoid:\quad}\delta(x) = \frac{1}{1 + e^{-x}},$ ${\rm tanh:\quad}tanh(x)=\frac{e^x - e^{-x}}{e^x + e^{-x}},$ ${\rm ReLu:\quad}relu(x)=max(0, x)。$