【深度学习】初识神经网络_一个神经网络的输入几纬-CSDN博客

本文链接：https://blog.csdn.net/weixin_42166222/article/details/114848209

一、感知机

1.感知机来源

深度学习里的感知机类似于人脑的神经元
人脑神经元

人脑神经元

2.单层感知机

在这里插入图片描述

单层感知机

上图是一个n维输入的单层感知机， $x_{1}$ 至 $x_{n}$ 是n维输入向量， $w_{1j}$ 至 $w_{nj}$ 是这n维输入向量连接的感知机权重， $f$ 为激活函数， $O_{j}$ 为输出标量。感知机的输出是输入向量 $x$ 和权重向量 $w$ 求内积后，经过激活函数 $f$ 得到的标量。

3.多层感知机

在这里插入图片描述

多层感知机

多层感知机（Multi-Layer Perceptron，即MLP）是由单层感知机推广而来，包含多个神经元层。一般将MLP的一层称为输入层，中间层称为隐藏层，最后一层为输出层。隐藏层可根据实际需求选择合适层数，隐藏层、输出层每层神经元个数也没有限制

二、神经网络

1.神经网络的参数更新

前向过程
即根据输入的 $x$ 得到输出 $y$ ，对于感知机来说前向传播就是 $y = w x + b$
损失
即网络输出与标签的差值
后向过程
用下面这个图例体会下

由上图设输出为 $y$ ，损失函数为 $E$
$\begin{array}{l} y=h_{1} w_{h 1}+h_{2} w_{h 2}=x_{1} w_{11}+x_{2} w_{12}+x_{2} w_{21}+x_{2} w_{22} \\ E=\frac{1}{2}(y-t)^{2} \end{array}$
那么计算 $E$ 对 $W_{h 1}$ 的误差传播值为： $\frac{\partial \mathrm{E}}{\partial w_{h 1}}=\frac{\partial \mathrm{E}}{\partial \mathrm{y}} \frac{\partial y}{\partial w_{h 1}}=(y-t) h_{1}$
下次更新 $W_{h 1}$ 这个参数的时候就可以采用（ $\eta$ 是学习率）： $w_{h 1}=w_{h 1}-\eta \frac{\partial E}{\partial w_{h 1}}$