在训练模型之前,我们首先需要将拿到的数据进行整理。
1.根据数据库导出的表格为所有文件夹重命名。
根据以.xlsx为后缀的excel表格为多个文件夹/文档同时重命名_小白_Y的博客-CSDN博客
2.将表格中的文件夹/文件从原始文件夹移动到新的文件夹中(为海量文件夹进行分类)
将表格中的文件夹/文件从原始文件夹移动到新的文件夹中(为海量文件夹进行分类)_小白_Y的博客-CSDN博客
3.为所有文件夹中的所有文件重命名为“文件夹名_源文件名”,使其具有唯一性。
为文件夹中的所有文件重命名为“文件夹名_源文件名”,使文件名具有唯一性_小白_Y的博客-CSDN博客
4.合并所有文件夹下的文件。
合并所有文件夹中的文件_小白_Y的博客-CSDN博客
5.从文件夹中提取后缀为.bmp和.json文件,其他文件类型可同时参考
从文件夹中提取后缀为.bmp和.json文件,其他文件类型可同时参考_小白_Y的博客-CSDN博客
6.处理(移出或删除)文件夹中.bmp和.json文件(文件类型可替换)一 一对应的数据之外的数据。
处理(移出或删除)文件夹中.bmp和.json文件(文件类型可替换)一 一对应的数据之外的数据_小白_Y的博客-CSDN博客
7.检查json标注是否符合要求,将不符合要求的json文件以及对应的bmp图片移动到相应文件夹。
检查json文件是否符合要求,将不符合要求的json文件以及所对应的bmp图片移动到另一个文件夹中_小白_Y的博客-CSDN博客
8.提取label值种类。
提出所有json文件中的label值_小白_Y的博客-CSDN博客