2021-09-26

数据集处理01

最近要开题了,任务繁重,一是数据集的整理工作,一是代码的学习;
记录一下这两天的处理任务吧,以后或许也能用的上。
感谢原码大神搭救
https://blog.csdn.net/weixin_43124425/article/details/108262898

第一部分是对于不同文件夹下同名文件进行比较,并划分出不同文件再另存。

import os
from shutil import copy

def main():
    file1_path = r'G:\research\AdvSemiSeg-master\dataset\DUT-USEG\SegmentationClassAug1'
    file2_path = r'G:\SegmentationClassAug2'
    # 遍历两个路径下的文件 对其中.png属性的文件进行筛选,和file1文件内容进行文件名(不含文件属性,只看名称)的对比找出不在对方文件中.png文件,保存到另外一个文件中
    # 对于 后缀不同的文件类型,如.jpg,.mp3,.py等等都适用,只需更改代码中后缀即可
    
    # 将fiile1文件夹下的所有文件去除后缀,只读取名称,同理对file2进行处理
    file1_list = set([_.split('.')[0] for _ in os.listdir(file1_path)])
    file2_list = set([_.split('.')[0] for _ in os.listdir(file2_path) if '.png' in _])
    
    # 找出两个列表中的不同部分,即是我们需要的文件
    diff_list = list(file1_list ^ file2_list)

    # 判断另存文件夹是否存在,若不存在则新建,命名为
    if not os.path.exists(os.path.join('G:/', 'diffrent_file')):
        os.mkdir(os.path.join('G:/', 'diffrent_file'))

    for d_file in diff_list:
        # from_path = os.path.join(pdf_path, d_file + '.pdf')
        from_path = os.path.join(pdf_path, d_file + '.png')

        to_path = os.path.join('G:/', 'diffrent_file')  # 保存不同名文件的文件夹

        copy(from_path, to_path)
        
        print(d_file + '.png' )


if __name__ == '__main__':
    main()
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值