分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow
也欢迎大家转载本篇文章。分享知识,造福人民,实现我们中华民族伟大复兴!
下载地址:mnist.pkl.gz
使用 python 读取和解析 mnist.pkl.gz
import pickleimport gzipdef load_data(): with gzip.open('./mnist.pkl.gz') as fp: training_data, valid_data, test_data = pickle.load(fp) return training_data, valid_data, test_data
- 1
- 2
- 3
- 4
- 5
- 6
- 7
可以看出,mnist.pkl.gz 分为训练集,校验集和测试集:
>> training_data, valid_data, test_data = load_data() # training_data, valid_data, test_data 均是二元 tuple # tuple of ndarray:feature and label>> len(training_data[0])50000>> len(valid_data[0])10000>> len(test_data[0])10000>> len(training_data[0][0])784 # 784 = 28*28
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
使用 PIL 中的图像相关 api,我们可对其中的图像显示出来:
from PIL import ImageI = training_data[0][0]I.resize((28, 28))im = Image.fromarray((I*256).astype('uint8'))im.show()
- 1
- 2
- 3
- 4
- 5
我们也可使用 数据集可视化——tile(”贴砖”) 对数据做更充分的展示。