深度学习自制、自定义数据集
数据有点大,仅供参考,主要是代码。
数据来源kaggle
# 引进待会要用的包
import os.path
import pandas as pd
# 训练集绝对路径
traindir = r"C:\Users\AIAXIT\Desktop\DeepLearningProject\Project\plant-seedlings-classification\train"
# 列出dir目录下的目录和文件
fileList = os.listdir(traindir)
#print(fileList)
# 训练集预处理
train = []
trainlabel = []
for i in fileList:
fileName = os.path.join(traindir, i) # 路径拼接
image = os.listdir(fileName) # 列出fileName下的图片
for j in image: # 逐个遍历
train.append(os.path.join(fileName, j)) # 添加到列表末尾
trainlabel.append(i)
dftrain = pd.DataFrame(train) # 转换到DataFrame
dflabel = pd.DataFrame(trainlabel)
# 测试集数据预处理
testdir = r"C:\Users\AIAXIT\Desktop\DeepLearningProject\Project\plant-seedlings-classification\test"
fileList = os.listdir(testdir)
test = []
for i in fileList:
test.append(i)
dftest = pd.DataFrame(test)
# print(dftest)
效果图:
训练集:
训练集label:
测试集:
后期自己要写进csv或者其它文件,自己写努力一下下,已经很简单了!