深度学习入门项目之MNIST(DeepLearning4j)

最新推荐文章于 2024-08-08 08:06:17 发布

nowacoder

最新推荐文章于 2024-08-08 08:06:17 发布

阅读量3.7k

点赞数

分类专栏：深度学习

本文链接：https://blog.csdn.net/yuih344/article/details/79233995

版权

本文通过Deeplearning4j库介绍如何使用MNIST数据集训练一个能识别手写数字的神经网络。内容包括设置超参数、构建神经网络模型，并对训练和测试过程进行了简述。

摘要由CSDN通过智能技术生成

MNIST是一个手写数字图像的数据集，每幅图像都由一个整数标记。它主要用于机器学习算法的性能对标。深度学习算法处理MNIST的效果相当好，准确率可达到99.7%以上。

我们将用MNIST来训练一个神经网络，使之能读取每幅图像并预测其中的数字。首先需要安装Deeplearning4j。

MNIST数据集包含一个有6万个样例的训练集和一个有1万个样例的测试集。训练集用于让算法学习如何准确地预测出图像的整数标签，而测试集则用于检查已训练网络的预测有多准确。

这在机器学习领域中被称为有监督学习，因为我们已经知道图像预测所应该得出的正确答案。训练集能起到监督和指导的作用，在神经网络预测错误时予以纠正。

我们将在这个文件中配置神经网络，训练模型，评估结果。建议您结合其中的代码来学习本教程。

设置变量

final int numRows = 28; // 矩阵的行数。
    final int numColumns = 28; // 矩阵的列数。
    int outputNum = 10; // 潜在结果（比如0到9的整数标签）的数量。
    int batchSize = 128; // 每一步抓取的样例数量。
    int rngSeed = 123; // 这个随机数生成器用一个随机种子来确保训练时使用的初始权重维持一致。下文将会说明这一点的重要性。
    int numEpochs = 15; // 一个epoch指将给定数据集全部处理一遍的周期。