深度学习 -- 神经网络 1

最新推荐文章于 2024-07-23 15:45:49 发布

nicolas_chang

最新推荐文章于 2024-07-23 15:45:49 发布

阅读量717

点赞数

分类专栏：深度学习文章标签：深度学习 Deep Learning 神经网络

本文链接：https://blog.csdn.net/nicolas_chang/article/details/83033282

版权

本文介绍了神经网络的基础知识，包括人体神经网络的工作原理、神经网络架构、参数定义、激活函数、损失函数和反向传播算法。通过一个简单的逻辑回归模型的神经网络示例，阐述了神经网络从初始化到前向传播、反向传播和参数更新的过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

image.png-92.5kB

上图为人体的神经网络，其工作原理：

随着神经网络的发展，现在已经不再使用上面的示例解释目前的神经网络了。这是因为现在的神经网络有反向传播的过程，但这个在人体的神经网络是没有这个过程的。

image.png-77.4kB

上图为一个简单的神经网络，每个圆圈代表一个神经元。最左侧为输入层，该层的神经元成为输入单元，最右侧的为输出层，该层神经元为输出单元，中间的层统称为隐藏层，这些层的单元称为隐藏单元。该网络为3层神经网络（输入层不记入网络层数）。

下面根据几个简单的实例来看下神经网络的工作过程。但在此之前，需要先介绍下神经网络中常用的参数：

General comments:

superscript $(i)$ will denote the $i^{th}$ training example while superscript $[l]$ will denote the $l^{th}$ layer

Sizes

Objects

$\in R^{n_x × m}$ : is the input matrix
$x^{(i)} \in R^{n_x}$ : is the $i^{th}$ example represented as a column vector
$\in R^{n_x × m}$ : is the label matrix
$y^{(i)} \in R^{n_x}$ : is the output label for the $i^{th}$ example