深度学习(三)-神经网络基础

最新推荐文章于 2024-03-28 07:14:54 发布

未名湖畔的落叶

最新推荐文章于 2024-03-28 07:14:54 发布

阅读量1.1k

点赞数

分类专栏：深度学习文章标签：深度学习 pytorch 神经网络

本文链接：https://blog.csdn.net/keyue123/article/details/89191244

版权

本文深入探讨了神经网络的基本组成——神经元，详细解释了激活函数的作用和不同类型，包括Sigmoid、Tanh、ReLU、Leaky ReLU、ELU以及Maxout。此外，还概述了神经网络的三种主要结构：前馈网络、反馈网络和图网络。重点讨论了ReLU的优缺点及其在深度学习中的广泛应用。

摘要由CSDN通过智能技术生成

前面我们利用pytorch实现了基于机器学习中最基本的的线性回归和逻辑回归，下面我们就正式开始接触神经网络，神经网络一般可以看作是一个非线性模型，其基本组成单位为具有非线性激活函数的神经元，通过大量神经元之间的连接，使得神经网络成为一种高度非线性的模型。神经元之间的连接权重就是需要学习的参数，可以通过梯度下降方法来进行学习。以下内容参考和摘抄自廖星宇老师的《深度学习之pytorch》和邱锡鹏老师的《神经网络与深度学习》。

1. 神经元

神经元是构成神经网络的基本单元，也被称为感知器，本质是通过上一层的输入与权重相乘后求和，在经过非线性函数转换，得到下一层的输出。也就是说神经元由输入，权值，偏置，激活函数，输出组成。
假设一个神经元接受 $d$ 个输入 ${x_i}$ ，用向量 $x = [x_i]$ 来表示这组输入，并用 $z$ 表示一个神经元所获得的输入信号 $x$ 的加权和
$\sum\limits_{i = 1}^d { {w_i}{x_i} + b = {w^T}x + b}$
其中 $w = [w_1, w_2, · · ·, w_d]$ 是 $d$ 维的权重向量， b 属于偏置。其结构如下所示：