处理气象数据——14

___Y1

已于 2024-05-23 13:10:36 修改

阅读量63

点赞数 1

分类专栏：气象数据处理文章标签： python 爬虫开发语言

于 2024-05-10 10:21:04 首次发布

本文链接：https://blog.csdn.net/weixin_44259522/article/details/138654017

版权

气象数据处理专栏收录该内容

47 篇文章 0 订阅

订阅专栏

import os
import pandas as pd

# 设置文件夹路径
folder_path = r'D:\qixiangshuju\甘肃'

# 获取文件夹中所有的.xls文件
files = [file for file in os.listdir(folder_path) if file.endswith('.xls')]

# 循环处理每个文件
for file in files:
    file_path = os.path.join(folder_path, file)
    # 读取Excel文件
    df = pd.read_excel(file_path)
    # 提取年份列的最小值和最大值
    min_year = df['年'].min()
    max_year = df['年'].max()
    # 构建新的文件名
    new_file_name = f"{file}_{min_year}_{max_year}.xls"
    # 构建新文件的路径
    new_file_path = os.path.join(folder_path, new_file_name)
    # 修改文件名
    os.rename(file_path, new_file_path)

这段代码是一个 Python 脚本，主要用于处理指定文件夹中的 Excel 文件。让我逐行解析并举例说明每行代码的功能：

1. `import os`: 导入 Python 中用于操作文件和文件夹的模块。

2. `import pandas as pd`: 导入 Pandas 库，Pandas 是 Python 中用于数据处理和分析的重要库。

3. `folder_path = r'D:\qixiangshuju\甘肃'`: 设置文件夹路径，这里是指定的文件夹路径，应该包含要处理的 Excel 文件。

4. `files = [file for file in os.listdir(folder_path) if file.endswith('.xls')]`: 使用列表推导式获取文件夹中所有以 `.xls` 结尾的文件名，并存储在 `files` 列表中。

5. `for file in files:`: 循环遍历 `files` 列表中的每个文件。

6. `file_path = os.path.join(folder_path, file)`: 构建当前文件的完整路径，使用 `os.path.join()` 函数来保证路径的正确拼接。

7. `df = pd.read_excel(file_path)`: 使用 Pandas 的 `read_excel()` 函数读取 Excel 文件，将其内容存储在 DataFrame 中，这里将 DataFrame 命名为 `df`。

8. `min_year = df['年'].min()`: 在 DataFrame 中选择 '年' 这一列，并使用 `min()` 函数找到该列的最小值，即年份的最小值。

9. `max_year = df['年'].max()`: 在 DataFrame 中选择 '年' 这一列，并使用 `max()` 函数找到该列的最大值，即年份的最大值。

10. `new_file_name = f"{file}_{min_year}_{max_year}.xls"`: 构建新的文件名，格式为原文件名加上最小年份和最大年份，用下划线分隔。

11. `new_file_path = os.path.join(folder_path, new_file_name)`: 构建新文件的完整路径，同样使用 `os.path.join()` 函数。

12. `os.rename(file_path, new_file_path)`: 使用 `os.rename()` 函数重命名文件，将原文件名修改为新的文件名。

举例说明：
假设文件夹中有两个 Excel 文件，分别是 `data1.xls` 和 `data2.xls`，它们的年份分别是 2010 到 2020 年，和 2005 到 2015 年。执行这段代码后，文件夹中的文件将会被重命名为：

- `data1.xls_2010_2020.xls`
- `data2.xls_2005_2015.xls`

这样，文件名中就包含了对应 Excel 文件中年份的范围。

import os
import pandas as pd

# 设置文件夹路径
folder_path = r'D:\qixiangshuju\甘肃'

# 获取文件夹中所有的.xls文件
files = [file for file in os.listdir(folder_path) if file.endswith('.xls')]

# 循环处理每个文件
for file in files:
file_path = os.path.join(folder_path, file)
# 读取Excel文件
df = pd.read_excel(file_path)
# 提取年份列的最小值和最大值
min_year = df['年'].min()
max_year = df['年'].max()
# 构建新的文件名
new_file_name = f"{file}_{min_year}_{max_year}.xls"
# 构建新文件的路径
new_file_path = os.path.join(folder_path, new_file_name)
# 修改文件名
os.rename(file_path, new_file_path)