glob()
、iterdir()
、is_file()
这三个方法。它们是 Python 的 pathlib.Path
对象中的方法,常用于读取目录里的文件。
📍背景前提
假设你有一个目录 /data/
,里面有如下内容:
/data/
├── report1.txt
├── report2.txt
├── summary.pdf
├── image.png
├── patient/
│ └── history.txt
1️⃣ iterdir()
是什么?
✅ 作用:
列出这个目录下的所有“第一层”子项(包括文件和文件夹,不会递归进入子目录)。
🧪 例子代码:
from pathlib import Path
dir_path = Path("/data")
for item in dir_path.iterdir():
print(item)
🖨️ 输出结果:
/data/report1.txt
/data/report2.txt
/data/summary.pdf
/data/image.png
/data/patient ← 注意这是个目录
✅ 总结:
iterdir()
就像是在说:“这个文件夹里有哪些东西?一眼列出来,别进子目录看。”
2️⃣ is_file()
是什么?
✅ 作用:
判断某个路径是不是普通文件,排除目录。
🧪 例子:
item = Path("/data/report1.txt")
print(item.is_file()) # True
item = Path("/data/patient")
print(item.is_file()) # False,这是个文件夹
✅ 总结:
is_file()
是在问:“你是不是一个文件?你不是个目录吧?”
3️⃣ glob("*.txt")
是什么?
✅ 作用:
列出当前目录下所有匹配某种模式的文件/文件夹(也只看第一层,不会进子目录)
🧪 例子:
dir_path = Path("/data")
for item in dir_path.glob("*.txt"):
print(item)
🖨️ 输出结果:
/data/report1.txt
/data/report2.txt
它不会输出
/data/patient/history.txt
,因为不会进子目录。
🧠 结合使用:例子
👇 我想列出 /data/
下所有 .txt
文件:
from pathlib import Path
dir_path = Path("/data")
txt_files = [f for f in dir_path.iterdir() if f.is_file() and f.suffix == ".txt"]
print(txt_files)
输出:
[
Path("/data/report1.txt"),
Path("/data/report2.txt")
]
✅ 总结表格
方法 | 人话解释 | 会返回什么 |
---|---|---|
.iterdir() | “把这个目录里有哪些东西列出来” | 所有文件 + 文件夹(不递归) |
.is_file() | “这个是个文件吗?” | True 或 False |
.glob("*.txt") | “这个目录下所有 .txt 文件给我列出来” | 所有匹配 .txt 后缀的路径(不进入子目录) |