利用对于kaggle商品图片的分类

本文介绍了一位初学者在kaggle上处理一个关于时尚服装分类的数据集,该数据集包含10类衣物,如T恤、裤子等。作者提到即使人眼难以区分某些类别,但通过CNN神经网络可以实现86.33%的高准确率。随后,文章分享了如何使用csv读取数据,并讨论了数据标准化和批量处理(batch)在训练过程中的重要性,强调批量化处理对于大数据集的必要性。
摘要由CSDN通过智能技术生成

偶然在kaggle上面看到一个比较适合初学者的数据集,这个数据集是对于一些时尚服装的分类,一共有10种物品分别是:

  • 0 T-shirt/top
  • 1 Trouser
  • 2 Pullover
  • 3 Dress
  • 4 Coat
  • 5 Sandal
  • 6 Shirt
  • 7 Sneaker
  • 8 Bag
  • 9 Ankle boot
  •  
  • 对应的中文是:
  • 0.T恤
  • 1.裤子
  • 2.套衫
  • 3.连衣裙
  • 4.大衣
  • 5.凉鞋
  • 6.衬衫
  • 7.运动鞋
  • 8.手提袋
  • 9.靴子

每个商品数据会有一个28x28 色位为1的图片数组,例如:

标签给的是4.大衣,话说这和套衫有什么区别?好像人眼都无法准确识别,但是通过CNN神经网络的学习准确率竟然高达86.33%!!!而且我认为一定可以更高

废话不多说开始上代码:

首先是利用csv这个包将csv文件读取到变量,也就是

csvreader=csv.reader(open(data_dir,encoding='utf-8'))

#这里需要将编码转换成utf-8格式否则会报错

1.首先将文件读取

 


                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值