数据集
图片简介
这项任务是预测树叶图像的类别。 该数据集包含176个类别,18353幅图像。 每个类别至少有50幅图像用于训练。
图片样品
代码实现
引入相关类库
import pandas as pd
import tensorflow as tf
import matplotlib.pyplot as plt
使用pandas读取csv文件,csv有两列,一列是图片位置,另一列是对应的标签。
df = pd.read_csv('../input/classify-leaves/train.csv')
df
csv的图像位置不完全正确,需要改成正确的相对位置(以当前运行目录为基准)。
df["image"] = "../input/classify-leaves/" + df["image"]
df
使用sample对dataframe文件进行打乱,frac=1是全选的意思,并重置索引,丢弃原索引。因为dataframe的真实排列是以索引为准,如果不更正索引,即使表面上看行被打乱,实际数据的排列也会跟原来一样。
df = df.sample(frac&