python-遍历文件取采集时间最大最小值

最新推荐文章于 2024-09-25 19:16:13 发布

hsd1096

最新推荐文章于 2024-09-25 19:16:13 发布

阅读量578

点赞数

CC 4.0 BY-SA版权

文章标签： python 开发语言

本文链接：https://blog.csdn.net/hsd1096/article/details/129801628

该代码示例展示了如何使用Python的os.walk遍历多级目录，结合正则表达式从txt文件名中提取14位数字形式的时间戳，并找出这些时间戳的最小值和最大值。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在一个文件夹中有很多txt文件文件名示例

E:\text\2023-01-01\cs\v4\x.x.x.x_20230304065016#.txt

E:\text\2023-01-01\cs\v4\x.x.x.x_20230304065004#.txt

按match = re.search(r"_(\d{14})#", file.name) 匹配得到采集时间，计算采集时间最大和最小的值

import os
import re

# 定义文件夹路径
folder_path = r"E:\text\2023-01-01\cs"

# 定义正则表达式模式，匹配采集时间
pattern = re.compile(r"_(\d{14})#")

# 定义列表，用于存储所有的采集时间
timestamps = []

# 遍历文件夹中的所有txt文件，并提取采集时间信息
for filename in os.listdir(folder_path):
    if filename.endswith(".txt"):
        match = pattern.search(filename)
        if match:
            timestamp = match.group(1)
            timestamps.append(timestamp)

# 输出最大值和最小值
if timestamps:
    print("最小值：", min(timestamps))
    print("最大值：", max(timestamps))
else:
    print("文件夹中没有符合条件的文件")

如果folder_path存在多级目录，可以使用Python的os.walk函数来遍历文件夹中的所有文件。os.walk函数可以递归地遍历文件夹中的所有子文件夹和文件，返回一个三元组(dirpath, dirnames, filenames)，其中dirpath是当前文件夹的路径，dirnames是当前文件夹中所有子文件夹的名称列表，filenames是当前文件夹中所有文件的名称列表。

以下是一个示例代码，使用os.walk函数来遍历多级目录中的所有txt文件，并提取采集时间信息。

import os
import re

# 定义文件夹路径
folder_path = r"E:\text\2023-01-01"

# 定义正则表达式模式，匹配采集时间
pattern = re.compile(r"_(\d{14})#")

# 定义列表，用于存储所有的采集时间
timestamps = []

# 遍历文件夹中的所有txt文件，并提取采集时间信息
for dirpath, dirnames, filenames in os.walk(folder_path):
    for filename in filenames:
        if filename.endswith(".txt"):
            match = pattern.search(filename)
            if match:
                timestamp = match.group(1)
                timestamps.append(timestamp)

# 输出最大值和最小值
if timestamps:
    print("最小值：", min(timestamps))
    print("最大值：", max(timestamps))
else:
    print("文件夹中没有符合条件的文件")