Python 获取指定文件夹下的目录和文件

come form : https://blog.csdn.net/u011520181/article/details/80866790

经常有需要扫描目录,对文件做批量处理的需求,所以对目录处理这块做了下学习和总结。Python 中扫描目录有两种方法:os.listdir 和 os.walk。

一、os.listdir 方法
os.listdir() 方法用于返回指定的目录下包含的文件或子目录的名字的列表。这个列表以字母顺序。其得到的是仅当前路径下的文件名,不包括子目录中的文件,如果需要得到所有文件需要递归。 它也不包括 '.' 和 '..' 即使它在目录中。

语法格式如下:


os.listdir(path)
实例代码


def list_dir(file_dir):
    '''
        通过 listdir 得到的是仅当前路径下的文件名,不包括子目录中的文件,如果需要得到所有文件需要递归
    '''
    print'\n\n<><><><><><> listdir <><><><><><>'
    print "current dir : {0}".format(file_dir)
    dir_list = os.listdir(file_dir)
    for cur_file in dir_list:
        # 获取文件的绝对路径
        path = os.path.join(file_dir, cur_file)
        if os.path.isfile(path): # 判断是否是文件还是目录需要用绝对路径
            print "{0} : is file!".format(cur_file)
        if os.path.isdir(path):
            print "{0} : is dir!".format(cur_file)
            list_dir(path) # 递归子目录

二、os.walk 方法
os.walk() 方法用于通过在目录树中游走输出在目录中的文件名,向上或者向下。是一个简单易用的文件、目录遍历器,可以帮助我们高效的处理文件、目录方面的事情。

语法格式如下:


os.walk(top[, topdown=True[, οnerrοr=None[, followlinks=False]]])
方法参数说明:

top:要遍历的目录的路径

topdown:可选,如果为 True,则优先遍历 top 目录,以及 top 目录下的每一个子目录,否则优先遍历 top 的子目录,默认为 True

onerror: 可选, 需要一个 callable 对象,当 walk 异常时调用

followlinks:可选, 如果为 True,则会遍历目录下的快捷方式(linux 下是 symbolic link)实际所指的目录,默认为 False

args:包含那些没有 '-' 或 '--' 的参数列表

返回值: 三元组 (root, dirs, files)

root :所指的是当前正在遍历的目录的地址

dirs :当前文件夹中所有目录名字的 list (不包括子目录)

files :当前文件夹中所有的文件 (不包括子目录中的文件)

实例


def work_dir(file_dir):
    print'\n\n<><><><><> work dir <><><><><>'
    for root, dirs, files in os.walk(file_dir):
        print'\n========================================'
        print "root : {0}".format(root)
        print "dirs : {0}".format(dirs)
        print "files : {0}".format(files)

        for file in files:
            try:
                print'-----------------------------------'
                
                file_name = os.path.splitext(file)[0]
                file_suffix = os.path.splitext(file)[1]
                file_path = os.path.join(root, file)
                file_abs_path = os.path.abspath(file)
                file_parent = os.path.dirname(file_path)

                print "file : {0}".format(file)
                print "file_name : {0}".format(file_name)
                print "file_suffix : {0}".format(file_suffix)
                print "file_path : {0}".format(file_path)
                print "file_abs_path : {0}".format(file_abs_path)
                print "file_parent : {0}".format(file_parent)
                
            except Exception, e:
                print "Exception", e

三、其他跟文件相关的常用方法
os.path.splitext():分离文件名和扩展名


file = "file_test.txt"
file_name = os.path.splitext(file)[0] # 输出:file_test
file_suffix = os.path.splitext(file)[1] # 输出:.txt
os.path.exists():判断文件或目录是否存在

os.path.isfile():判断是否是文件

os.path.isdir():判断是否是目录

os.path.dirname():获取当前文件所在的目录,即父目录

os.makedirs():创建多级目录

os.mkdir():创建单级目录

os.path.getsize():获取文件大小
 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值