paddle中进行数据集解压及划分数据集

在paddle中使用

下面的代码是将指定文件夹下的数据压缩包进行解压到指定文件夹中。

# 将测试数据集放入./dataset目录下
%cd ~
!cp data/liversegtrain.zip dataset/
!unzip -o data/liversegtrain.zip -d dataset/

 

第一幅为解压前的liversegtrain,第二幅为解压后的文件。

接下来对解压后的数据进行分组,分为训练数据集、验证数据集和测试数据集。

import os
base_dir = "/home/aistudio/dataset/liversegtrain/" # CT图片所在路径
img_dirs = ["mask_liver", "patient"] # 两类CT图片文件夹名

file_names = ["train_list.txt", "val_list.txt", "test_list.txt"]
splits = [0, 0.6, 0.8, 1] # 按照 6 2 2 的比例对数据进行分组

for split_ind, file_name in enumerate(file_names):
    with open(os.path.join("./dataset", file_name), "w") as f:
        for typ
  • 1
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值