数据整理流程

在训练模型之前,我们首先需要将拿到的数据进行整理。

1.根据数据库导出的表格为所有文件夹重命名。
根据以.xlsx为后缀的excel表格为多个文件夹/文档同时重命名_小白_Y的博客-CSDN博客
2.将表格中的文件夹/文件从原始文件夹移动到新的文件夹中(为海量文件夹进行分类)
将表格中的文件夹/文件从原始文件夹移动到新的文件夹中(为海量文件夹进行分类)_小白_Y的博客-CSDN博客
3.为所有文件夹中的所有文件重命名为“文件夹名_源文件名”,使其具有唯一性。
为文件夹中的所有文件重命名为“文件夹名_源文件名”,使文件名具有唯一性_小白_Y的博客-CSDN博客
4.合并所有文件夹下的文件。
合并所有文件夹中的文件_小白_Y的博客-CSDN博客
5.从文件夹中提取后缀为.bmp和.json文件,其他文件类型可同时参考
从文件夹中提取后缀为.bmp和.json文件,其他文件类型可同时参考_小白_Y的博客-CSDN博客
6.处理(移出或删除)文件夹中.bmp和.json文件(文件类型可替换)一 一对应的数据之外的数据。
处理(移出或删除)文件夹中.bmp和.json文件(文件类型可替换)一 一对应的数据之外的数据_小白_Y的博客-CSDN博客
7.检查json标注是否符合要求,将不符合要求的json文件以及对应的bmp图片移动到相应文件夹。
检查json文件是否符合要求,将不符合要求的json文件以及所对应的bmp图片移动到另一个文件夹中_小白_Y的博客-CSDN博客
8.提取label值种类。

提出所有json文件中的label值_小白_Y的博客-CSDN博客

9.将json文件转换为xml文件。
(1)写入label标注。
根据json中label的种类,将label写为二分类标注labelName和moreLabelName,并写入xml文件的object中。
将json文件转换为xml文件,并写入相关属性_小白_Y的博客-CSDN博客
(2)写入points标注。
根据json文件中的points坐标,将标注区域的最小及最大的x,y坐标写入xml文件的object的bndbox中。
将json文件转换为xml文件,并写入相关属性_小白_Y的博客-CSDN博客
 (3)根据表格将病人基本信息(姓名,性别,年龄,身高,体重,疾病,医院,受试者编号,目录编号等)写入xml文件的info中。
将表格信息写入xml文件_小白_Y的博客-CSDN博客
10.根据bmp图片以及json文件生成jpg文件(相同类型的病灶区的颜色一致,不同类型的病灶区的颜色不一致)。
根据bmp图像及json文件生成jpg图片_小白_Y的博客-CSDN博客
11.计算不同label病灶区的图像个数。
根据json文件计算不同label值的个数_小白_Y的博客-CSDN博客

到这里我们的整理数据就结束了。 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值