从 0 开始机器学习 - 神经网络识别手写字符！

最新推荐文章于 2024-05-02 12:32:14 发布

登龙

最新推荐文章于 2024-05-02 12:32:14 发布

阅读量445

点赞数

分类专栏：机器学习文章标签：神经网络 python 机器学习人工智能

本文链接：https://blog.csdn.net/cdeveloperV/article/details/106326745

版权

今天登龙跟大家分享下使用前馈神经网络识别 10 种类型手写字符的方法，不太了解神经网络基础的同学，可以查看我上一篇文章：从 0 开始机器学习- 深入浅出神经网络基础

我们的目标就是用一个已经训练好的神经网络来预测下面这 10 类手写字符 [0 - 9]：

每个字符是一个 20 X 20 = 400 像素的图片：

OK！我们直接开始，先来看看我们用的神经网络的架构。

我们在使用神经网络之前需要进行参数的训练，也就是训练权重矩阵，这篇博客就不详细展开如何训练了，后面单独写一篇反向 BP 算法的文章介绍。

不管是训练还是预测，我们都要首先搞清楚使用的神经网络架构是怎样的，也就是输入输出层有多少节点，有多少个隐藏层，每个隐藏层有多少节点，这些很重要，因为每层的节点数都作为权重矩阵的行和列，在预测的时候要使用这些权重矩阵。

我们这个例子使用的的 3 层神经网络，我来给你详细分析下这个架构：

结构搞清楚后，我们直接开始预测，下面我带你解析关键的 Python 代码，完整代码见文末 Github 仓库链接。

我们使用提前训练好的神经网络参数，再提醒一下训练神经网络就是训练每层之间的连接权重，这些连接权重组和起来就是权重矩阵，相邻的 2 层之间有一个权重矩阵，我们就是加载这些矩阵，然后用这些矩阵与输入图像的 400 个像素组成的向量一步步相乘，最终得出一个 1 X 10 的向量表示预测的数字是哪个。

加载权重的代码如下：

# 加载已经训练好的 3 层神经网络参数
def load_weight(path):
    data = sio.loadmat(path)
    return data['Theta1'], data['Theta2']

我们来加载 2 个权重矩阵（因为我们是 3 层神经网络，所以只有 2 个权重矩阵哦）：

关注