这是 Kaggle 上的一个学习项目,任务是识别航拍图像中是否有柱状仙人掌。
数据下载:https://www.kaggle.com/c/aerial-cactus-identification/data
Kaggle 提供了 17500 张图片,其中 4000 张未标注的作为测试集。如果你的模型能够正确标注 4000 张图片,就会得满分 1 或者 100%。
1.运行环境
win10+python3+TensorFlow-GPU-1.10
2.准备数据
Train 文件夹里包含所有的训练图片。
Test 文件夹是用于提交的测试图片。
Train CSV 文档里包含训练数据的信息,将图片名与列 has_cactus 映射,如果该列有 cactus,则值为 1,否则为 0。
Sample Submission CSV 中是提交所需的格式。文件名和 Test 文件夹中的图片相对应。
train_df = tf.read_csv("train.csv")
然后我目前还没找到利用TensorFlow实现下面这个步骤的方法:
将 Train CSV 文档加载到数据帧中。利用 ImageList from_df 方法创建加载生成器,以便将 train_df 数据帧和 train 文件夹中的图像进行映射。
原文是用Pytorch,并且使用 FastAI。
有待学习中....