自定义image captioning数据集的格式整理(完整版)
作者:安静到无声 个人主页
目录
-
- 自定义image captioning数据集的格式整理(完整版)
- 1. 数据集的整理
- 2 端到端的形式直接生成所有所需数据(一个代码)
- 推荐专栏
1. 数据集的整理
1.1 将原始文件合并到uic_new_split(保证验证集和测试集数据是同步的)
我们按照8:1:1的标准重新划分数据集。我们创建新的文件夹/home/lihuanyu/Data/00uic_data/uic_new_split
,将原始文件下的图片(包括train,test和val)都移动到新的文件夹下,文件名字为uic_new_split
。
1.1.1 将原始测试集,验证集和训练集合并
创建一个文件/home/lihuanyu/Data/00uic_data/uic_new_split/uic
,然后将/home/lihuanyu/Data/00uic_data/uic_split/papar1_keybox/原始图片/uic_tes