识别数字0和1的简单网络

最新推荐文章于 2022-10-01 11:55:10 发布

爱吃肉夹馍的公子渝

最新推荐文章于 2022-10-01 11:55:10 发布

阅读量915

点赞数 1

文章标签：机器学习深度学习神经网络

本文链接：https://blog.csdn.net/csdn548364/article/details/107061134

版权

《深度学习的数学》给予了我极大的启发，作者阐述的神经网络的思想和数学基础令我受益颇多，但是由于书中使用Excel作为示例向读者展示神经网络，这对我这样一个不精通Excel的人来说很头疼，因此我打算使用Python来实现书中的一个简单网络模型，即识别数字0和1的模型。
这个网络模型极其简单，比号称机器学习中的“Hello World”的手写数字识别模型更简单，它基本没有实用价值，但是我之所以推崇它，只因为它褪去了神经网络的复杂性，展示了神经网络中最基本、最根本的东西。
模型总共分为三层，第一层为输入层，第二层为隐藏层，第三层为输出层。输入层包括12个输入输出变量 $x_i (i=1,2,...,12)$ ,隐藏层包括三个神经单元，输出层包括两个神经单元。
下面是涉及到的数学知识。
神经网络的参数是通过将代价函数（损失函数）最小化来确定的，本文所使用的的最小化方法是梯度下降法，但是直接计算梯度是很困难的，因此引入了误差反向传播法，通过计算出输出层的误差，然后通过误差的递推公式计算出隐藏层的误差。
<隐藏层>
$z_1^2$ = $\sum_{i=1}^{12}w_{1i}^2x_i+b_1^2$
$z_2^2$ = $\sum_{i=1}^{12}w_{2i}^2x_i+b_2^2$
$z_3^2$ = $\sum_{i=1}^{12}w_{3i}^2x_i+b_3^2$
$a_i^2=a(z_i^2) (i=1,2,3)$
<输出层>
$z_1^3$ = $\sum_{i=1}^{3}w_{1i}^3a_i^2+b_1^3$
$z_2^3$ = $\sum_{i=1}^{3}w_{2i}^3a_i^2+b_2^3$
$a_i^3=a(z_i^3) (i=1,2)$
$C=1/2*((t_1-a_1^3)^2+(t_2-a_2^3)^2)$ ，其中 $z_j^l$ 为层l的第j个神经单元的加权输入的值， $w_{ij}^{l+1}$ 为层l的第j个神经单元指向层l+1的第i个神经单元的箭头的权重， $b_j^l$ 表示层l的第j个神经单元的偏置， $a_j^l$ 为层l的第j个神经单元的输出，a(z)为激活函数,C为平均误差，

	含义	图像为0	图像为1
$t_1$	0的正解变量	1	0
$t_2$	1的正解变量	0	1

	图像为0	图像为1
$a_1^3$	接近1的值	接近0的值
$a_2^3$	接近0的值	接近1的值

输出层L的误差公式
$δ_j^L= \frac{\partial C}{\partial a_j^L}a'(z_j^L)$

最低0.47元/天解锁文章

爱吃肉夹馍的公子渝

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
识别数字0和1的简单网络

《深度学习的数学》给予了我极大的启发，作者阐述的神经网络的思想和数学基础令我受益颇多，但是由于书中使用Excel作为示例向读者展示神经网络，这对我这样一个不精通Excel的人来说很头疼，因此我打算使用Python来实现书中的一个简单网络模型，即识别数字0和1的模型。这个网络模型极其简单，比号称机器学习中的“Hello World”的手写数字识别模型更简单，它基本没有实用价值，但是我之所以推崇它，只因为它褪去了神经网络的复杂性，向我展示了神经网络中最基本、最根本的东西。模型总共分为三层，第一层为输入层，第
复制链接

扫一扫