1 致谢
感谢陈助教和钟老师的帮助!
2 标注文件的格式设计
标注的文件的格式我们选择CSV文件格式,因为CSV是数据科学中一种十分常用的数据格式,而且结合pandas包可以实现很多便利的数据操作,所以我们选择CSV文件格式。
2.1 设置主键——ImageID
在标注文件中,我们需要设置主键,来区分不同图像的ID(一定要设置主键!会有很多很方便的用处!);
主键在人脸数据库中可以是数据集中图片文件的子路径,在 Digit Recognizer中我们也是用过图片的序号(从1开始)作为图像文件的主键;
主键可以是整形也可以是字符串;