数据批量处理时,通常需要对文件夹及文件夹中的文件进行操作。使用os模块,这里记录几个常用的功能。
1.判断文件夹或者文件是否存在,使用os.path.exists()函数,返回值为TRUE或FALSE
import os
path = 'D:\\test'
r = os.path.exists(path)
2.创建某个文件夹。直接在os.makedirs()中输入要创建文件夹的路径。删除文件夹使用os.rmdir(),删除文件则使用os.remove()
import os
path = 'D:\\test'
os.makedirs(path) #创建文件夹
os.rmdir(path) #删除文件夹
3.文件路径合并os.path.join(),将文件夹路径和其中的某个文件名结合,得到该文件的路径
import os
path = 'D:\\test'
file = '1.txt'
a = os.path.join(path,file)
4.获取文件或文件夹信息,包括创建时间os.path.getctime(),修改时间os.path.getmtime(),访问时间os.path.getatime()。注意,返回的时间为一个float数值,单位为秒,该数值相对的起始时间是1970年1月1日零点,可通过time.ctime()将其转为可读的日期。
import os,time
path = 'D:\\test'
r = os.path.getmtime(path)
r_2 = time.ctime(r)
5.读取某个文件夹中的文件列表,直接在os.listdir中输入文件夹的路径。注意返回值为list,包括该文件夹下的所有文件和文件夹的名字,排序方式默认为名称。
import os
path = 'D:\\test'
a = os.listdir(path)
6.读取某个文件夹中的文件列表,按时间排序。需要结合4和5,先读取文件列表,随后获取每个文件的时间信息,再通过sort函数排序。
import os
path = 'D:\\test'
list = os.listdir(path)
list_sort = sorted(list,key=lambda x: os.path.getctime(os.path.join(path, x)))