前言
如题,有些时候涉及到在不同的系统平台上对文件做一些操作,但是往往有一些操作并不是兼容的,比如说
Mac OS/Linux
系统和
Windows
系统之间,Python 里的
os
模块的某些功能便不是兼容的。
接下来给大家安利一款文件处理和路径相关操作的库
pathlib
。
正文
首先,假设现在我们有这样一个需求,将某个目录中带有
.txt
后缀的文件修改成
.csv
的形式,那么根据以往经验,我们可以使用
os
模块来解决这个需求如下:
import os
def modify_suffix(path):
for file_name in os.listdir(path):
base_name, suffix = os.path.splitext(file_name)
if suffix == '.txt':
file_path = os.path.join(path, file_name)
os.rename(file_path, os.path.join(path, f'{base_name}.csv'))
上面的代码块用到了下面这些函数:
os.listdir(path)
:列出
path
目录下的所有文件(含文件夹);
os.path.splitext(filename)
:切分文件名里面的基础名称和后缀部分;
os.path.join(path,filename)
:组合需要操作的文件名为绝对路径;
os.rename(...)
:重命名某个文件。
上面的代码实现下来,对于我这个‘老手’来说可能没什么,但是对于新手,无疑需要记住的东西有点多,其实我们还可以使用其它的方式进行替代。
使用
pathlib
模块改写代码:
pathlib
是
Python Version 3.4
以后开始引入的一个新的标准库模块。为了让文件处理变的更简单,它基于面向对象思想设计,封装了非常多与文件操作相关的功能。改写代码如下:
from pathlib import Path
def modify_suffix_with_pathlib(path):
for file_path in Path(path).glob('*.txt'):
file_path.rename(file_path.with_suffix('.csv'))
上述代码的解释:
首先使用
Path(path)
将字符串路径转换为
Path
对象;
调用
.glob('*.txt')
对路径下所有文件内容进行模式匹配并返回生成器对象,结果仍然是
Path
对象,所以我们可以接着做后面的操作;
使用
.with_suffix(suffix)
返回一个新的路径并修改
suffix
。如果原本的路径没有后缀,新的
suffix
则被追加以代替。如果
suffix
是空字符串,则原本的后缀被移除;
调用
.rename(target_name)
完成原文件的重命名。
显然,使用
pathlib
完成上述的需求比使用
os
完成要更加的简洁和方便。
另外,我们也提到了,在不同的系统平台,表示路径的方式也有些许区别,最典型的
Mac OS/Linux
系统和
Windows
系统,路径分隔符的表示方式就不一样,一个是斜杠“/”,一个是反斜杠“\”,同样一段表示路径的代码,很明显有些时候无法在两个平台上通用,怎么办?使用
pathlib
就对了!!!
# 方法一:使用 os.path 模块
>>> import os
>>> os.path.join(r'\foo', 'bar')
'\\foo\\bar'
# 方法二:使用 os 模块
>>> import os
>>> r'\foo' + os.sep + 'bar'
'\\foo\\bar'
# 方法三:使用 pathlib 模块
>>> from pathlib import Path
>>> Path(r'\foo') / 'bar'
WindowsPath('/foo/bar')
>>> print(Path(r'\foo') / 'bar')
\foo\bar
>>> Path(r'\foo').joinpath(*['a', 'b', 'c'])
WindowsPath('/foo/a/b/c')
获取文件名及后缀:
>>> filename = Path("foo.txt")
>>> filename.name
'foo.txt'
>>> filename.suffix
'.txt'
>>> filename.stem
'foo'
# 判断文件是否真实存在
>>> filename.exists()
False
使用
pathlib
来读取文件中的内容:
# 以前的标准读取文件的方法:
with open('bar.txt') as f:
context = f.read(buffer)
print(context)
# 使用pathlib的做法:
from pathlib import Path
all_context = Path(bar.txt").read_text()
如果你想要一次性读取文件中的所有内容,显然使用
pathlib
的优势更加明显,但是,如果你想按字节读取或者按行读取,使用以前的标准做法更接地气!
当然,除了以上这些好用的功能之外,
pathlib
还有其它的实用功能,建议大家闲暇时可以去
官方文档
一睹为快!
其中给大家再安利一个黑魔法:
PEP-519
里定义了一个专门用于“文件路径”的新对象协议,这意味着从该
PEP
生效后的
Python Version 3.6
版本起,
pathlib
里的
Path
对象,可以和以前绝大多数只接受字符串路径
os.PathLike
的标准库函数兼容使用:
>>> path = Path(r'\foo')
>>> os.path.join(path, 'bar')
'\\foo\\bar'
所以,事不宜迟,以后只要是涉及到路径的操作,都可以使用
pathlib
快速帮你实现!
对了,如果你使用的还是较早的
Python
版本,可以尝试安装使用
pathlib2
这个库,效果杠杠滴!