编程的一个小麻烦之一是:Microsoft Windows在文件夹名称之间使用反斜杠字符,而几乎所有其他计算机都使用正斜杠:
Windows filenames:
C:\some_folder\some_file.txt
Most other operating systems:
/some_folder/some_file.txt
1
2
3
4
5
6
Windowsfilenames:
C:\some_folder\some_file.txt
Mostotheroperatingsystems:
/some_folder/some_file.txt
这是一个意外--1980年早期的计算机历史记录。MS-DOS的第一个版本使用正斜杠字符来指定命令行选项。当Microsoft在MS-DOS 2.0中添加对文件夹的支持时,正斜杠字符已被采用,因此它们使用反斜杠。三十五年后,我们仍然陷于这种不相容的窘境。
如果你希望你的Python代码可以在Windows和Mac / Linux上工作,你需要处理这些特定于平台的问题。幸运的是,Python 3有一个名为pathlib的新模块,它能很愉悦地处理文件兼容问题。
让我们快速浏览一下处理文件名路径的不同方法,就会发现pathlib如何让你的生活更美好!
错误的解决方案:手动建立文件路径
假设您有一个数据文件夹,其中包含Python程序,并想用程序打开的文件夹:
在Python中,这样编码是错误方式:
data_folder = "source_data/text_files/"
file_to_open = data_folder + "raw_data.txt"
f = open(file_to_open)
print(f.read())
1
2
3
4
5
data_folder="source_data/text_files/"
file_to_open=data_folder+"raw_data.txt"
f=open(file_to_open)
print(f.read())
请注意,我在Mac上使用Unix风格的正斜杠对路径进行了硬编码。这会让Windows用户很生气。
技术上讲,该代码在Windows上仍将工作,因为Python有一个黑技术,当在Windows上使用open()函数,无论是哪种斜线的Python都会识别。但即使如此,你也不应该依赖这一点。如果在错误的操作系统上使用错误类型的斜线,并不是所有的Python库都可以正常工作—— 特别是当它们与外部程序或库连接时。
而Python对混合斜线类型的支持是仅适用于Windows操作系统的黑技术,在其他操作系统它不能正常工作。在Mac中使用反斜杠,代码中的将会报错。
出于这些原因,使用硬编码路径字符串编写代码会使其他程序员傻瓜一样看你。一般来说,你应该尽量避免它。
旧解决方案:Python的os.path模块
Python的os.path模块有很多工具用于解决这些特定于操作系统的文件系统问题。
您可以使用os.path.join()为当前操作系统使用正确类型的斜杠构建路径:
import os.path
data_folder = os.path.join("source_data", "text_files")
file_to_open = os.path.join(data_folder, "raw_data.txt")
f = open(file_to_open)
print(f.read())
1
2
3
4
5
6
importos.path
data_folder=os.path.join("source_data","text_files")
file_to_open=os.path.join(data_folder,"raw_data.txt")
f=open(file_to_open)
print(f.read())
这段代码可以在Windows或Mac上完美工作。问题是这是一个痛苦的使用。写出os.path.join()并将路径的每个部分作为一个单独的字符串传递是很罗嗦的,也是不直观的。
由于os.path模块中的大部分函数都是类似的恼人的使用,开发人员通常会忘记使用它们,即使他们知道使用这些会更好。这导致了很多跨平台的bug和愤怒的用户。
更好的解决方案:Python 3的pathlib!
Python 3.4引入了一个新的标准库,用于处理文件和路径称为pathlib的。 这真是太棒了!
要使用它,只需使用正斜杠将路径或文件名传递到新的Path()对象中,然后Path()会处理剩下的部分:
from pathlib import Path
data_folder = Path("source_data/text_files/")
file_to_open = data_folder / "raw_data.txt"
f = open(file_to_open)
print(f.read())
1
2
3
4
5
6
frompathlibimportPath
data_folder=Path("source_data/text_files/")
file_to_open=data_folder/"raw_data.txt"
f=open(file_to_open)
print(f.read())
这里需要注意两点:
你应该在pathlib函数中使用正斜杠。Path()对象为当前的操作系统将正斜杠转换成正确的斜线。太好了!
如果要添加到路径中,可以直接在代码中使用/运算符。告别重复输入os.path.join(a,b)。
如果这就是所有pathlib所做的,那么这对Python来说将是一个很好的补充 - 但它还有更多的功能!
例如,我们可以读取文本文件的内容,而不必打开和关闭文件:
from pathlib import Path
data_folder = Path("source_data/text_files/")
file_to_open = data_folder / "raw_data.txt"
print(file_to_open.read_text())
1
2
3
4
5
frompathlibimportPath
data_folder=Path("source_data/text_files/")
file_to_open=data_folder/"raw_data.txt"
print(file_to_open.read_text())
实际上,pathlib使得大多数标准的文件操作变得简单快捷:
from pathlib import Path
filename = Path("source_data/text_files/raw_data.txt")
print(filename.name)
print(filename.suffix)
print(filename.stem)
if not filename.exists():
print("Oops, file doesn't exist!")
else:
print("Yay, the file exists!")
1
2
3
4
5
6
7
8
9
10
11
12
13
14
frompathlibimportPath
filename=Path("source_data/text_files/raw_data.txt")
print(filename.name)
print(filename.suffix)
print(filename.stem)
ifnotfilename.exists():
print("Oops, file doesn't exist!")
else:
print("Yay, the file exists!")
你甚至可以使用pathlib将Unix路径显式转换成Windows格式的路径:
from pathlib import Path, PureWindowsPath
filename = Path("source_data/text_files/raw_data.txt")
path_on_windows = PureWindowsPath(filename)
print(path_on_windows)
1
2
3
4
5
6
frompathlibimportPath,PureWindowsPath
filename=Path("source_data/text_files/raw_data.txt")
path_on_windows=PureWindowsPath(filename)
print(path_on_windows)
如果你真的想安全地在你的代码中使用反斜杠,你可以声明你的路径为Windows格式,并且pathlib可以为当前操作系统将它转换正确的格式:
from pathlib import Path, PureWindowsPath
filename = PureWindowsPath("source_data\\text_files\\raw_data.txt")
correct_path = Path(filename)
print(correct_path)
1
2
3
4
5
6
7
frompathlibimportPath,PureWindowsPath
filename=PureWindowsPath("source_data\\text_files\\raw_data.txt")
correct_path=Path(filename)
print(correct_path)
如果你想要的话,你甚至可以使用pathlib来完成解析相关文件路径,解析网络共享路径以及生成file:// urls。下面是一个例子,它用两行代码,使你在Web浏览器中打开一个本地文件:
from pathlib import Path
import webbrowser
filename = Path("source_data/text_files/raw_data.txt")
webbrowser.open(filename.absolute().as_uri())
1
2
3
4
5
frompathlibimportPath
importwebbrowser
filename=Path("source_data/text_files/raw_data.txt")
webbrowser.open(filename.absolute().as_uri())
这只是pathlib的一个小高峰。它可以替代许多不同的文件相关的功能,这些功能曾经分散在不同的Python模块中。
查看更多关于pathlib的使用