数据集下载地址为
下载下来的图片包是,包含有猫狗的图片,但是命名方式就是以猫狗来命名的,所以我们可以很快将他们分类出来,并把他们以90%作为训练集,剩下的作为 测试集
前期准备工作:
- 下载数据集
- 在新建train和test文件夹
- 在train和test文件及里,再建cat和dog文件夹
- 执行代码
代码:
import shutil
import torch
import torch.nn as nn
import torchvision
import os
# 数据分类处理
## 提取文件夹内的名字
data_file = os.listdir('./data/train')
## 索引猫和狗的图片名字
dog_file = list(filter(lambda x: x[:3] == 'dog', data_file))
cat_file = list(filter(lambda x: x[:3] == 'cat', data_file))
## 移动图片
root = './data/train/'
for i in range(len(dog_file)):
pic_path = os.path.join(root, dog_file[i + 1])
# print(dog_file[i+1])
# print('*******************************')
# print(pic_path)
if i < len(dog_file)*0.9 :
obj_path = './data/train/dog/' + dog_file[i + 1]
else:
obj_path = './data/test/dog/' + dog_file[i + 1]
shutil.move(pic_path, obj_path)
for i in range(len(cat_file)):
pic_path = os.path.join(root, cat_file[i + 1])
if i < len(cat_file)*0.9:
obj_path = './data/train/cat/' + cat_file[i + 1]
else:
obj_path = './data/test/cat/' + cat_file[i + 1]
shutil.move(pic_path, obj_path)