Python获取数据集下指定后缀文件名list并保存为csv格式

需求:找出data目录下,不同子文件夹内的指定后缀为dcm的文件名,生成list,保存为csv格式

import fnmatch
import os
import pandas as pd
import numpy as np
import sys

InputStra = sys.argv[1] # 运行时,需要指定参数1为data路径 
InputStrb = sys.argv[2] # 参数2为 .dcm的后缀文件,也可以是别的后缀,如.jpg,*表示所有

def ReadSaveAddr2(Stra, Strb):
    df = pd.DataFrame(np.arange(0).reshape(0,1), columns=['Addr'])
    print(df)
    path = InputStra    
    for dirpath,dirnames,filenames in os.walk(path):
        #for filename in filenames:
        a_list = fnmatch.filter(os.listdir(dirpath), Strb)
        if len(a_list):
            dft = pd.DataFrame(np.arange(len(a_list)).reshape((len(a_list),1)),columns=['Addr'])
            dft.Addr = a_list
            # dft.Addr = dirpath + '\\' + dft.Addr#输出绝对路径
            frames = [df, dft]
            df = pd.concat(frames)
            print(df.shape)
    df.to_csv('list.csv', columns=['Addr'], index=False, header=False)
    print("Write list !")

# 在命令行中输入例如如下格式的命令
# python get_namelist.py /data/dataset/xxx/naru_data *.dcm 

ReadSaveAddr2(InputStra, InputStrb)

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值