使用python搭建一个简易的神经网络实现对手写数字的识别（每行代码都有注释）

最新推荐文章于 2023-04-12 11:24:00 发布

Foools

最新推荐文章于 2023-04-12 11:24:00 发布

阅读量525

点赞数

文章标签：神经网络 python

本文链接：https://blog.csdn.net/foools/article/details/115316899

版权

本文介绍了如何使用Python搭建一个简单的神经网络，实现对手写数字的识别。核心思想是通过多个线性分类器组合，利用sigmoid函数模拟神经元行为，并通过反向传播误差调整权重。代码实现部分展示了网络结构，包括输入、隐藏和输出层的节点数量，以及训练后的高准确率。

摘要由CSDN通过智能技术生成

一些简单的介绍

如果一个简单的线性分类器不能对数据进行划分，我们就需要使用多个线性分类器来划分数据；使用多个分类器一起工作，这是神经网络的核心思想。

神经元不会立刻有输入就产生反应，而是会抑制输出，知道输入增强，强大到可以触发输出，一般我们会用sigmod函数来模拟阶跃函数。

输入到下一层结果矩阵中的信号，可以表示为X = W·I，W表示权值矩阵，I表示输入矩阵。这样一来，第二层的最终输出就称为O = sigmod（X）在这里插入图片描述

神经网络通过调整链接权重进行学习，这种方法由误差引导。

内部节点相关联的误差：一种方法是按照链接权重的比例来分割输出层的误差，然后在每个内部节点处重组这些误差。（反向传播误差）

反向传播误差和前向馈送信号都可以使用矩阵实现。

梯度下降法是求解函数最小值的一种很好的办法，函数有很多参数的时候，这种方法仍然可以使用。

两个很常见的问题是饱和和零值权重：大信号（可能由大权重导致）导致了应用在信号上的激活函数的斜率变得非常平缓，这会降低神经网络学习到更好权重的能力；零权值的问题可能导致网络丧失学习更好权重的能力。

输入应该调整到较小值（参考sigmod函数的近0点），但不能为0；输出应该在激活函数能生成的值的范围内。

代码实现

代码逻辑：
通过反向传播误差来实现对神经网络链接权值的更新
代码输入节点，隐藏层节点，输出层节点分别为784，200，10个，目前的代码是通过调整了训练次数，学习率，隐藏层节点数量之后形成的，拥有最好的学习效果的模型，预测的准确率可以达到96%以上

import numpy
import scipy.special

class neuralNetwork:
    def __init__(self, inputNode, hiddenNode, outputNode, learningRate):
        self.inodes = inputNode
        self.hnodes = hiddenNode
        self.onodes = outputNode

        # 设置权重 input--hidden
        self.wih = numpy.random.normal(0.0, pow(self.hnodes, -0.5), (self.hnodes, self.inodes))
        # 设置权重 input--hidden
        self.who = numpy.random.normal(0.0, pow(self.onodes, -0.5), (self.onodes, self.hnodes)