glob 是 Python 中的一个模块,用于查找与指定模式匹配的文件路径。它特别适用于在目录中搜索文件,而不需要知道文件的确切名称。glob 模块提供了一个名为 glob() 的函数,它接受一个字符串参数,该参数是一个通配符模式,然后返回一个列表,其中包含了所有匹配该模式的文件路径。
直接上代码示例了:
我的python_train文件夹中有四个文件,这样就可以根据后缀全部读取了
import glob
# 设置文件夹路径
folder_path = './python_train'
# 读取文件夹中所有jsonl文件
files = glob.glob(f'{folder_path}/*.jsonl')
print(files)
print(type(files))
输出:
['./python_train\\1.jsonl', './python_train\\2.jsonl', './python_train\\3.jsonl', './python_train\\4.jsonl']
<class 'list'>