训练过程

最新推荐文章于 2021-08-25 00:01:42 发布

Sunshine_faner

最新推荐文章于 2021-08-25 00:01:42 发布

阅读量794

点赞数 1

1、准备样本

在一个复杂的网络中，我们准备一定数量的用来训练的 x 向量，可以是文本，可以是图片，可以是音频，甚至可以是音视频结合的更为复杂的训练样本，当然只要是输入到网络中作为训练样本的一定是向量化的。

2、清洗处理

在放人网络进行训练之前，需要进行一定处理，处理的目的是为了帮助网络更高效、更准确地做好分类。

3、正式训练

这里写图片描述

根据网络中两个神经元的表达式描述：
$z_{h}=w_hx+b_h,y_h=\dfrac{1}{1+e^{-z_h}}$
$z_{o}=w_oy_h+b_o,y_o=\dfrac{1}{1+e^{-z_o}}$
$x_1$ 一旦代入后，就会是这样一个映射关系：
$z_{h1}=w_hx_1+b_h,y_{h1}=\dfrac{1}{1+e^{-z_{h1}}}$
$z_{o1}=w_{o}y_{h1}+b_o,y_{o1}=\dfrac{1}{1+e^{-z_{o1}}}$
由 $x_1,y_1$ 带来的误差值可以定义了 $Loss_1=(y_{o1}-y_1)^2$
由10个训练数据共同带来的误差值就变成了： $Loss=\sum^{10}_{i=1}(y_{o1}-y_1)^2$ 也就是需要更新以下四个表达式：
$(w_h)^n=(w_h)^{n-1}-\eta\dfrac{\partial Loss}{\partial w_h}$
$(b_h)^n=(b_h)^{n-1}-\eta\dfrac{\partial Loss}{\partial b_h}$
$(w_o)^n=(w_o)^{n-1}-\eta\dfrac{\partial Loss}{\partial w_o}$
$(b_o)^n=(b_o)^{n-1}-\eta\dfrac{\partial Loss}{\partial b_o}$
首先将
$Loss=\sum^{10}_{i=1}(y_{o1}-y_1)^2\implies Loss=\frac{1}{2}\sum^{10}_{i=1}(y_{o1}-y_1)^2$

Sunshine_faner

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
训练过程

1、准备样本在一个复杂的网络中，我们准备一定数量的用来训练的 x 向量，可以是文本，可以是图片，可以是音频，甚至可以是音视频结合的更为复杂的训练样本，当然只要是输入到网络中作为训练样本的一定是向量化的。2、清洗处理在放人网络进行训练之前，需要进行一定处理，处理的目的是为了帮助网络更高效、更准确地做好分类。3、正式训练根据网络中两个神经元的表达式描述： zh=whx...
复制链接

扫一扫