Python中的os模块是主要和系统操作相关的模块,在平时的工作中会经常用到,花时间整理了os模块的高频使用方法,同时整理出使用时需要注意的点。归纳来讲,os模块的方法可以分为:目录操作、文件操作、路径操作、系统操作等四大类,我们接下来依次进行介绍。
目录操作相关
创建、删除、重命名目录
# 当前目录下创建目录,注意第二个参数mode,在Windows被忽略
os.mkdir("test_folder")
# 删除目录,如果目录不为空,则抛出OSError:[Errno 66] Directory not empty
os.rmdir("test_folder")
# 遍历创建目录,可以创建多个目录,其中exist_ok为False,表示目录存在抛出异常。
os.makedirs("a/b/c", exist_ok=False)
# 遍历删除目录,可以直接,注意如果目录不为空,会抛出OSError:[Errno 66] Directory not empty
os.removedirs("a/b/c")
# 对文件或者目录进行重命名,不能对路径做变更
os.rename("a", "b")
# os.rename的升级版本,可以重命名文件,也可以重命名文件的上级目录。
os.renames("b", "a/b")
遍历目录
# 对目录a下的文件进行遍历,返回目录下的名字列表,注意不会遍历子目录
file_name_list = os.listdir("a")
print(file_name_list)
'''
功能:会递归遍历对目录a下的文件和目录
参数:topdown表示遍历目录的优先级(True先遍历根目录,False先遍历子目录)
onerror 当walk遇到错误时会调用
返回值:
parent 指的是父目录,
dir_name返回parent目录下所有的目录
file_name返回parent目录下所有的文件
'''
list_result = os.walk("a", topdown=True, onerror=None, followlinks=False)
for parent, dir_name, file_name in list_result:
print(parent)
print(dir_name)
print(file_name)
print("============")
# 和listdir类似,都是对第一层目录遍历,区别在于scandir返回的是迭代器
with os.scandir("a") as it:
print("*"*12)
for entry in it:
print(entry.name)
需要注意的是,如果要遍历的目录下文件数量比较多,比如数百万个文件,那么就可以使用os.scandir(),因为如果这时使用listdir()会造成内存紧张。
获取目录
# 获取当前工作目录所在的绝对路径
print(os.getcwd())
# 返回.. 表示当前目录的上级目录
print(os.pardir)
# 返回上级目录,这里用到了os.path.abspath,获取绝对路径
print(os.path.abspath(os.path.dirname(os.getcwd())))
# 用于改变当前工作目录
os.chdir("a")
print(os.getcwd())
判断目录
# 判断路径a是否存在
print(os.path.exists("a"))
# 判断路径a是否是目录
print(os.path.isdir("a"))
# 判断路径a是否是文件
print(os.path.isfile("a"))
文件属性
'''
功能:返回文件/目录对应的属性
返回值:st_mode(权限模式)=16877, st_ino(inode节点号)=12897368202,
st_dev(inode所在设备号)=16777220, st_nlink(inode链接数)=5, st_uid(文件所有者id)=501,
st_gid(文件所有者的组id)=20, st_size(文件大小)=160, st_atime(上次访问的时间)=1577449111,
st_mtime(最后一次修改的事件)=1577449111, st_ctime(创建时间)=1577449111)
'''
print(os.stat("."))
# 同样,os也提供了单独获取某个属性的方法
print(os.path.getatime("."))
print(os.path.getctime("."))
print(os.path.getmtime("."))
print(os.path.getsize("."))
# 修改文件的访问时间和修改时间
os.utime(".", (1577449111, 1577449111))
在上面注释中提到的inode,主要用来存储文件的"元信息",比如文件的创建时间、文件的大小等,中文名叫作"索引节点"。
读写文件
# Python的os提供了open和write方法来读写文件
# 打开文件
fd = os.open("test3.txt", os.O_RDWR | os.O_CREAT)
# 这里返回的是一个文件描述符
print(fd)
# 写入字符串
os.write(fd, b"This is test")
# 将字符串刷新到硬盘上
os.sync()
# 关闭文件
os.close(fd)
# 作为对比,Python提供了open方法可以更方便的操作文件,所以我们一般直接使用open方法。
with open("a/test3.txt", "wb") as f:
# 这里返回的是一个操作文件的BufferedWriter对象
print(f)
f.write(b"aaaaaaaaa")
路径操作
# 获取路径的相对路径
print(os.path.abspath("."))
# 判断路径是否是相对路径
print(os.path.isabs("."))
# 将路径拼接在一起
print(os.path.join(os.getcwd(), "a","b"))
# 将传入的路径的最后一级目录/文件拆分开,比如:传入a/b/c/d 返回: a/b/c , d
print(os.path.split(os.getcwd()))
# 返回传入路径所在的目录,比如:传入a/b/c/d 返回:/a/b/c
print(os.path.dirname(os.getcwd()))
# 将传入path分割为路径和扩展,比如:传入a/b/c/d.txt 返回('a.b/c/d', '.text')
print(os.path.splitext(os.path.abspath("./a/test3.txt")))
执行系统命令
# 注意这里执行的命令一定是在执行的操作系统存在的命令,比如在linux系统用ls,在windows系统用dir
# 在当前进程中打开一个子shell(子进程)来执行命令
# 返回值:命令的执行状态 0 执行成功、非0,表示执行不成功。 会将命令的执行结果写入到stdout中,也就是控制台。
print(os.system("la"))
print("================")
'''
参数:cmd:要执行的命令。
mode:打开文件的模式,默认为'r',用法与open()相同。
buffering:0意味着无缓冲;1意味着行缓冲;其它正值表示使用参数大小的缓冲。
负的bufsize意味着使用系统的默认值,一般来说,对于tty设备,它是行缓冲;对于其它文件,它是全缓冲。
返回:这个方法会返回一个管道,返回一个连接管道的文件对象,比如为f,可以通过f.readlines()和f.read()来读取返回值。
'''
with os.popen("ls", "r", 1) as p:
print(type(p))
r = p.read()
print(r)
print("end")
不过Python提供了更强大的subprocess模块,使用subprocess.popen()方法会更加灵活。我们后面会专门写文章来介绍subprocess这个模块的各种方法的使用。
系统操作
# 返回当前进程的id
print(os.getpid())
# 返回操作系统的信息
print(os.uname())
# 返回系统的环境变量
print(os.environ)
# 返回系统的环境变量,PATH对应的值
print(os.environ.get('PATH'))
总结
上面总结了python3中os模块常用的方法,主要围绕对路径、目录及系统命令的操作,大家在平时使用过程中可以灵活使用上面的各种方法,有时候需要多个方法搭配使用。我给大家留两个练习题,这是我之前写python脚本碰到的问题:
- 获取某个目录下面最新的文件
- 将所有以error.log结尾的文件,全部放到某个对应目录下。
大家可以思考下,然后在评论区写下你的答案。
关注【公众号:软件测试布道师】,回复【python】,即可获取【python自动化及编程实践资料】