前言
对于刚入门AI的童鞋来说,mnist 数据集就相当于刚接触编程时的 “ hello world ” 一样,具有别样的意义,后续许多机器学习的算法都可以用该数据集来进行简单测试。
mnist数据来源:戳这里。
从官网上下载下来的数据是以下格式的,我想大多数人都不太熟悉。
网站也给出了数据集的格式,但是要手动解析这些数据也是有点复杂的。
所以我们会想着如果这些文件能转换成我们常用的csv格式,txt格式该多好啊。如果你有这个需求,下面的程序可以帮助你。
转换代码
以下代码的功能是将训练集和训练标签集成到一个csv文件里(测试文件同),运行完之后你会得到一个训练数据文件和一个测试数据文件。
def convert(imgf, labelf, outf, n):
f = open(imgf,