标准库是 Python 内置的库,Python 共有 300 多个标准库,这些标准库提供了基础但丰富的功能。在数据处理过程中,尤其是批量处理数据时,不可避免地需要对文件进行读写、重命名等处理,有时还需要进行目录的创建、删除、遍历等操作。Python 中的os
模块正是处理这些问题必备的工具库之一。
os
全称为Operating System,这个模块提供了与操作系统交互的各种函数,我们可以通过这些函数调用计算机底层操作系统的部分功能来快速、高效地管理文件和目录。os
库在数据处理中一个比较常见的功能是批量读取文件路径。
os模块的导入:
import os
os模块的功能:
对文件或目录(文件夹)进行读取、创建、删除、重命名等基本操作。
os模块的使用:
导入模块后,输入os.会列出os的使用方法,如下:
例如:
查看当前工作目录
我们可以使用os.getcwd()函数来获取当前工作目录的路径:
print(os.getcwd())
改变当前工作目录
如果我们想改变当前工作目录,可以使用os.chdir()函数:
os.chdir('/path/to/new/directory')
获取文件和目录列表
我们可以使用os.listdir()函数来获取指定目录下的所有文件和目录的列表:
print(os.listdir('/path/to/directory'))
文件和目录操作
要创建一个新的目录,可以使用os.mkdir()函数:
os.mkdir('/path/to/new/directory')
要删除一个目录,可以使用os.rmdir()函数:
os.rmdir('/path/to/directory')
重命名文件或目录
要重命名一个文件或目录,可以使用os.rename()函数:
os.rename('/path/to/old/file', '/path/to/new/file')
要获取一个文件的属性,可以使用os.stat()函数:
print(os.stat('/path/to/file'))
要修改一个文件的权限,可以使用os.chmod()函数:
os.chmod('/path/to/file', 0o755)
要获取一个文件的大小,可以使用os.path.getsize()函数:
print(os.path.getsize('/path/to/file'))
获取文件创建时间和修改时间
要获取一个文件的创建时间和修改时间,可以使用os.path.getctime()和os.path.getmtime()函数:
import os.path
import time
# 获取文件创建时间
print(time.ctime(os.path.getctime('/path/to/file')))
# 获取文件修改时间
print(time.ctime(os.path.getmtime('/path/to/file')))
要合并多个路径,可以使用os.path.join()函数:
print(os.path.join('/path/to', 'file'))
要分割一个路径,可以使用os.path.split()函数:
print(os.path.split('/path/to/file'))
要判断一个路径是否存在,可以使用os.path.exists()函数:
print(os.path.exists('/path/to/file'))
要判断一个路径是文件还是目录,可以使用os.path.isfile()和os.path.isdir()函数:
print(os.path.isfile('/path/to/file'))
print(os.path.isdir('/path/to/directory'))
获取文件名和文件扩展名
要获取一个路径的文件名和文件扩展名,可以使用os.path.basename()和os.path.splitext()函数:
print(os.path.basename('/path/to/file'))
print(os.path.splitext('/path/to/file'))
要执行一个系统命令,可以使用os.system()函数:
os.system('command')
要获取一个环境变量的值,可以使用os.getenv()函数:
print(os.getenv('VAR_NAME'))
要设置一个环境变量的值,可以使用os.environ()函数:
os.environ['VAR_NAME'] = 'value'
要获取当前用户名,可以使用os.getlogin()函数:
print(os.getlogin())