Deep Learning常用的一些数据集简介

1.前言

单纯觉得有一个数据集整合之后的分享会帮助到有需要的人,我也在一点点整理当中,把接触到的数据集都整理在这篇文章中,希望以后做训练时可以更加方便。

2.数据集

MNIST数据集

MNIST(Mixed National Institute of Standards and Technology database),是一个非常简单的机器学习视觉数据集,由几万张28像素x28像素的手写数字组成,只包含图片的灰度值信息,用于图像分类。
数据集信息:
训练集:55000
测试集:10000
验证集:5000
数据集的下载与读取:
import tensorflow as tf   
from tensorflow.examples.tutorials.mnist import input_data  
  
mnist = input_data.read_data_sets("MNIST_data/",one_hot = True) 

CIFAR-10数据集

CIFAR-10数据集包含60000张32x32的彩色图像,其中训练集50000张,测试集10000张,CIFAR-10数据集如同它的名字,一共标注为10类,每一类图片6000张。这10类分别为:airplane、automobile、bird、cat、deer、dog、frog、horse、ship和truck,其中没有重复。
数据集下载:
git clone https://github.com/tensorflow/models.git
cd models/tutorials/image/cifar10
数据集读取:
import cifar10,cifar10_input

ImageNet数据集

ImageNet项目由斯坦福大学终身教授李飞飞创办,目标是收集大量带有标注信息的图片数据供计算机视觉模型训练。ImageNet拥有1500万张标注过的高清图片,总共拥有22000类,其中拥有100万张标注了图片中主要物体的定位边框。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值