MNIST Training

最新推荐文章于 2021-12-08 14:12:08 发布

xx润物细无声

最新推荐文章于 2021-12-08 14:12:08 发布

阅读量310

点赞数

文章标签：机器学习

http://blog.csdn.net/u013508213/article/details/53401655

MNIST Training

MNIST是在机器学习领域中的一个经典问题。该问题解决的是把28x28像素的灰度手写数字图片识别为相应的数字，其中数字的范围从0到9。

MNIST是ML界的’hello world’，这个比喻还挺有意思的。

MNIST Data

MNIST数据集有四个文件：

train-images-idx3-ubyte.gz：训练集图片 - 55000 张训练图片，5000 张验证图片。
train-labels-idx1-ubyte.gz：训练集图片对应的数字标签。
t10k-images-idx3-ubyte.gz：测试集图片 - 10000 张图片。
t10k-labels-idx1-ubyte.gz：测试集图片对应的数字标签。

这些文件本身并没有使用标准的图片格式存储。在下面代码中extract_images()和extract_labels()函数可以手动解压他们。

图片数据将被解压成2维的tensor：[image index, pixel index] 其中每一项表示某一图片中特定像素的强度值。”image index”代表数据集中图片的编号，从0到数据集的上限值。”pixel index”代表该图片中像素点的个数, 从0到图片的像素上限值。

以train-*开头的文件中包括60000个样本，其中分割出55000个样本作为训练集，其余的5000个样本作为验证集。因为所有数据集中28x28像素的灰度图片的尺寸为784，所以训练集输出的tensor格式为[55000, 784]。

数字标签数据被解压成1维的tensor：[image index]，它定义了每个样本数值的类别分类。对于训练集的标签来说，这个数据规模就是：[55000]。

解压重构图片和标签数据之后，会得到如下数据集对象：

data_sets.train：55000 组图片和标签，用于训练。
data_sets.validation：5000 组图片和标签，用于迭代验证训练的准确性。
data_sets.test：10000 组图片和标签, 用于最终测试训练的准确性。

调用以下代码中的read_data_sets()函数，将会返回一个DataSet实例，其中包含了以上三个数据集。

函数DataSet.next_batch()是用于获取以batch_size为大小的一个元组，其中包含了一组图片和标签，该元组会被用于当前的TensorFlow运算会话中。

这里tensorflow版本不同导致的该函数的参数形式的区别：

resized_image = tf.image.resize_images(img_data_jpg,28,28, method=0)

xx润物细无声

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
MNIST Training

http://blog.csdn.net/u013508213/article/details/53401655MNIST TrainingMNIST是在机器学习领域中的一个经典问题。该问题解决的是把28x28像素的灰度手写数字图片识别为相应的数字，其中数字的范围从0到9。MNIST是ML界的’hello world’，这个比喻还挺有意思的。MNIST Data
复制链接

扫一扫

xx润物细无声 CSDN认证博客专家 CSDN认证企业博客

码龄7年

59: 原创

7万+: 周排名

2万+: 总排名

16万+: 访问

: 等级

2090: 积分

32: 粉丝

50: 获赞

38: 评论

168: 收藏

私信

关注

热门文章

分类专栏

最新评论

size_t 无符号整数，循环--踩坑
CSDN-Ada助手: 不知道算法技能树是否可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
yolov8后处理——DFL卷积如何卷
xx润物细无声: 不客气，0 ~（reg_max-1）卷积，作者设置的reg_max为16，所以是0~15卷积，为什么是16我也不清楚
yolov8后处理——DFL卷积如何卷
StarsZ66: 大佬，我想问问DFL为什么是和0~15卷积啊，这一部分看不太懂，有参考的资料吗，谢谢。
yolov5训练数据集中的部分类别
Lin.沐沐: 请问coco数据集，如果只训练前几个，除了nc还需要改代码和names数组吗
yolov5训练数据集中的部分类别
Reborn_Shimada: 请问如果发生读取了nc列表之外的数据报错该如何解决。就像index 59 is out of bounds for dimension 1 with size 16 我跳过了比较多的标注文件，读取到我需要训练的类别已经已经超出nc的规定数量。要么就AssertionError: Label class 1 exceeds nc=1 in data/coco128.yaml. Possible class labels are 0-0 这个报错感觉原因都是一样超出数组里面的范围但是我又想训练超出范围的类别。除了重新生成标注文件还有其他方法解决吗？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。