晓查 发自 凹非寺
量子位 出品 | 公众号 QbitAI
![a2373e9d035d11828758afbcb10ed35f.png](https://i-blog.csdnimg.cn/blog_migrate/fe938bc9a279a00896c68d8c2f3c6946.jpeg)
MNIST数据集是图像分类领域的基准测试之一,用于0~9手写数字图像分类任务,包含6万张训练图像和1万张测试图像。它已经有20多年的历史了。
但是官方测试集因为测试集样本太少,MNIST通常被认为不能提供有意义的置信区间。
现在,来自纽约大学两位研究人员给MNIST测试集再增加5万张图片,叫做QMNIST,获得校友、也是MNIST发起者LeCun转发。
LeCun给予了这个数据集很高的评价,认为它“重生、恢复、扩展”了MNIST。
![1bd8508162b8da840a1d4eaee7e00fc7.png](https://i-blog.csdnimg.cn/blog_migrate/2e1cd9ff8fbee30c9e3434c81859b645.jpeg)
数据集内容
QMNIST扩展数据集包含以下一些文件。
![41fe18ebfcc8026a79d57db8a6aaf5b6.png](https://i-blog.csdnimg.cn/blog_migrate/948b554874e79fe8c3bf8421b0921298.jpeg)
其中,前两个gz压缩文件和标准MNIST数据文件格式相同,不同的是QMNIST包含6万个测试样本。
前10000个QMNIST测试样本与MNIST测试集是逐一匹配的,后50000个示例是根据MNIST用算法重建的数据集。
使用方法
QMNIST的GitHub页上提供了Pytorch平台的QMNIST数据加载器,需要将数据集下载至与pytorch.py相同的文件夹下将网络下载选项设置为download=’True’。
它与标准的Pytorch MNIST数据加载器兼容。
from
传送门
数据集地址:
facebookresearch/qmnistgithub.com![2cbe0120703bdccbc450193fbbd025c8.png](https://i-blog.csdnimg.cn/blog_migrate/63e0baa06e15cf65aa223760e88b3a60.png)
论文地址:
Cold Case: The Lost MNIST Digitsarxiv.org—完—
量子位 · QbitAI
վ'ᴗ' ի 追踪AI技术和产品新动态
戳右上角「+关注」获取最新资讯↗↗
如果喜欢,请分享or点赞吧~比心❤