MNIST数据集规则化

最新推荐文章于 2024-08-31 11:43:10 发布

xuzhenlei1234

最新推荐文章于 2024-08-31 11:43:10 发布

阅读量8.3k

点赞数 3

分类专栏：机器学习算法 python

本文链接：https://blog.csdn.net/u013473520/article/details/51043631

版权

本文介绍了MNIST手写数字数据集的规则化过程，包括数据集介绍、图像预处理的步骤，如图像阈值化处理和调整数字位置，以适配实际应用中的图像。通过这些预处理技术，可以提高模型对非标准手写数字的识别精度。

摘要由CSDN通过智能技术生成

MNIST 数据集规则化

作为大三的我，前一段时间搞了手写数字识别，什么支持向量机啊，人工神经网络啊，knn啊，都玩过了，但仅仅是停留在人家公开的训练数据集上，而拿来测试用的图片也是人家的，比如mnist上的图片是这样的。

而我们拍的照片却是这样的

这样就带来了一个问题，测试的结果就不对了，用这样的图片去测试训练好的模型，可能有时候精度连10%都达不到。

这样，有必要将MNIST的生成过程学习一遍。

MNIST数据集

MNIST数据集是一个手写数字的集合，包含了60000个训练集和10000个测试集。每一个数字都是20x20的，包含在28x28的图片里面。这对于我们预处理是非常重要的。

预处理

#我们先预处理图片
i = 0
for no in [8,0,4,3]:
    gray = cv2.imread("own_"+str(no)+".png", cv2.IMREAD_GRAYSCALE)

    gray = cv2.resize(255-gray,(28,28))

    cv2.imwrite("preprocessing/proImage_"+str(no)+".png",gray)

得到的图片是这样的：

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

xuzhenlei1234

关注关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

MNIST数据集

liupc的学习笔记

03-12

2万+

一、MNIST数据集介绍点击此处返回总目录二、MNIST数据集下载三、常用的操作 ...

ConvLSTM-Moving-mnist:使用convlstm预测运动mnist数据集

04-28

ConvLSTM-Moving-mnist Using convlstm to prediction moving mnist dataset. run main.py for train 1、network structure 使用其中一个序列，迭代训练，收敛。前10帧--第11帧，...，第10-19帧预测第20帧。输入mnist序列三层conv 一层BasicConvLstmCel 三层conv flatten （1，10，64，64，1）（1，10，64，64，16）（1，1，64，64，1024）（1，1，64，64，1） 2、result 3、loss curve

1 条评论您还未登录，请先登录后发表或查看评论

为什么数据都要做一个归一化预处理

升级迭代

03-20

2545

神经网络学习过程本质就是为了学习数据分布,一旦训练数据与测试数据的分布不同,那么网络的泛化能力也大大降低;另外一方面，一旦每批训练数据的分布各不相同(batch 梯度下降),那么网络就要在每次迭代都去学习适应不同的分布,这样将会大大降低网络的训练速度。 YOLOv2网络通过在每一个卷积层后添加batch normalization，极大的改善了收敛速度同时减少了对其它regularization...

人工智能开发实战MNIST数据集及神经网络完全解析

最新发布

sinat_30844883的博客

08-31

1325

Pytorch MNIST数据集标准化为什么是transforms.Normalize((0.1307,), (0.3081,))

Harpoon_fly的博客

12-13

1万+

Pytorch已经提供了MNIST数据集，只要调用datasets.MNIST()下载即可，这里要注意的是标准化（Normalization）： transforms.Normalize((0.1307,), (0.3081,)) 标准化（Normalization）和基于决策树的机器学习模型，如RF、xgboost等不同的是，神经网络特别钟爱经过标准化处理后的数据。标准化处理指的是，data...

caffe学习笔记4-- 手写数字mnist训练过程

thystar的专栏

02-24

1万+

通过mnist数据集的训练，来看一下caffe的运行过程 1. 准备数据首先，我们需要从网上下载数据，在caffe根目录下运行一下命令 ./data/mnist/get_mnist.sh ./examples/mnist/create_mnist.sh 运行完后，会出现如下两个文件： mnist_train_lmdb, and mnist_test_lmdb

mnist数据集png图片

01-10

**MNIST数据集详解** MNIST（Modified National Institute of Standards and Technology）是一个广泛使用的手写数字识别数据库，常被用于机器学习和深度学习领域的图像识别训练。该数据集由美国国家标准与技术研究...

模仿mnist数据集制作自己的数据集代码.zip

02-15

在深度学习领域，数据集是模型训练的基础，MNIST数据集是入门级图像识别任务的典型代表，包含0-9的手写数字图像。本压缩包提供了模仿MNIST数据集制作自己数据集的代码，这对于初学者理解数据预处理、数据增强以及...

感知机算法实现(使用MNIST数据集)_Python环境

05-16

在这个Python环境中，我们将利用MNIST数据集来实现感知机算法，MNIST是一个广泛使用的手写数字识别数据集，包含了60,000个训练样本和10,000个测试样本。首先，我们需要导入必要的库，如numpy用于数值计算，...

机器学习中训练集和测试集归一化（matlab版）

weixin_42296976的博客

07-19

9230

转载自 https://blog.csdn.net/lkj345/article/details/50352385 背景介绍：归一化后加快了梯度下降求最优解的速度，归一化有可能提高精度。训练集和测试集归一化方法相同。 数据集不小，81*132337，81行表示包含81维属性，132337列表示包含132337条训练数据。数据中包含NaN数据。使用matlab中的mapmin...

用python对训练集和测试集进行特征规范化处理

归去来兮的博客

09-09

1万+

个人理解这里的规范化处理指对提取后的特征集进行处理，不是对原始的数据信号进行处理，包括归一化和标准化。规范化的原因：不同特征具有不同量级时会导致：a.数量级的差异将导致量级较大的特征占据主导地位；b.数量级的差异将导致迭代收敛速度减慢；c.依赖于样本距离的算法对于数据的数量级非常敏感。归一化：，也就是原数据减去该特征列最小值，再除以该特征列的极差，将属性缩放到[0,1]之间。标准化：,...

MNIST导入图片数据集

实践求真知

04-23

1万+

一 MNIST简介MNIST是一个入门级的计算机视觉数据集。当我们开始学习编程时，第一件事往往是学习打印Hello World。在机器学习入门的领域里，我们会用MNIST数据集来实验各种模型。MNIST里包含各种手写数字图片。也包含每张图片对应的标签，告诉我们这个数字几。MNIST数据集合的官网是http://yann.lecun.com/exdb/mnist/二 MNIST编程一般步骤1 导入M...

详解 MNIST 数据集

热门推荐

Liu-Cheng Xu

07-17

32万+

MNIST 数据集已经是一个被”嚼烂”了的数据集, 很多教程都会对它”下手”, 几乎成为一个 “典范”. 不过有些人可能对它还不是很了解, 下面来介绍一下.MNIST 数据集可在 http://yann.lecun.com/exdb/mnist/ 获取, 它包含了四个部分: Training set images: train-images-idx3-ubyte.gz (9.9 MB, 解压后 47

ndi图像处理

lihanlun的专栏

05-29

1237

The model itself is written in keras, but to prepare vector labels I used scipy.ndimage.morphologyscipy.ndimage.morphology.distance_transform_edt() is very useful to find distance and direction to the...

MATLAB实现图像灰度归一化

越野者的博客

03-11

6万+

在许多图像处理系统中，对图像进行归一化都是必备的预处理过程。一般而言，对于灰度图像（或彩色通道的每个颜色分量）进行灰度归一化就是：使其像素的灰度值分布在0~255之间，避免图像对比度不足（图像像素亮度分布不平衡）从而对后续处理带来干扰。一种常见的图像归一化原理1是y=(x-MinValue)/(MaxValue-MinValue) 其中x、y分别为归一化前、归一化后的值，MaxValue、MinV

Python计算机视觉：在阈值化图像中使用center_of_mass()函数寻找每个物体的中心坐标

Classic_Sans的博客

08-16

4418

Python计算机视觉：在阈值化图像中使用center_of_mass()函数寻找每个物体的中心坐标《Python计算机视觉》第一章练习第七题：使用形态学操作处理阈值化图像。在发现一些参数能够产生好的结果后，使用center_of_mass()函数寻找每个物体的中心坐标，将其在图像中绘制出来。以下是我的尝试： from PIL import Image from numpy import *...

libsvm中数据归一化的重要性

刘伟的博客

05-23

1万+

这两天用Python来实现手写数字识别，刚开始用原始数据进行训练，结果预测结果都是同一个类别，全部是对应数字1。正确率也只有10%左右，下面是代码及运行结果截图：预测结果都是数字1。数据归一化是指将特征值从一个大范围映射到[0,1]或者[-1,1]，如果原始值都是正数，则建议选择映射到[0,1]；如果原始值有正数又有负数，则建议映射到[-1,1]；具体情况需要具体分析。映射到[0,1]的实现

TensorFlow实现残差网络：MNIST数据集实战

"tensorflow实现残差网络方式(mnist数据集), Linux内核完全注释, Makefile简介" 在本文中，我们将探讨与TensorFlow实现残差网络(Residual Network)相关的内容，以及与Linux开发和Makefile相关的基础知识。首先，...