偶然在kaggle上面看到一个比较适合初学者的数据集,这个数据集是对于一些时尚服装的分类,一共有10种物品分别是:
- 0 T-shirt/top
- 1 Trouser
- 2 Pullover
- 3 Dress
- 4 Coat
- 5 Sandal
- 6 Shirt
- 7 Sneaker
- 8 Bag
- 9 Ankle boot
- 对应的中文是:
- 0.T恤
- 1.裤子
- 2.套衫
- 3.连衣裙
- 4.大衣
- 5.凉鞋
- 6.衬衫
- 7.运动鞋
- 8.手提袋
- 9.靴子
每个商品数据会有一个28x28 色位为1的图片数组,例如:
标签给的是4.大衣,话说这和套衫有什么区别?好像人眼都无法准确识别,但是通过CNN神经网络的学习准确率竟然高达86.33%!!!而且我认为一定可以更高
废话不多说开始上代码:
首先是利用csv这个包将csv文件读取到变量,也就是
csvreader=csv.reader(open(data_dir,encoding='utf-8'))
#这里需要将编码转换成utf-8格式否则会报错
1.首先将文件读取