处理气象数据——8

___Y1

已于 2024-05-23 13:17:12 修改

阅读量94

点赞数 1

分类专栏：气象数据处理文章标签： python 爬虫开发语言

于 2024-05-10 10:16:31 首次发布

本文链接：https://blog.csdn.net/weixin_44259522/article/details/138653716

版权

气象数据处理专栏收录该内容

50 篇文章 2 订阅

订阅专栏

import os
import pandas as pd

# 设置文件夹路径
folder_path = r'D:\qixiangshuju\西北降水_气温数据\陕西'

# 获取文件夹中所有的.xls文件
files = [file for file in os.listdir(folder_path) if file.endswith('.xls')]

# 循环处理每个文件
for file in files:
    file_path = os.path.join(folder_path, file)
    # 读取Excel文件
    df = pd.read_excel(file_path)
    # 打印文件名
    print("文件名:", file)
    # 打印年这一列的最大值和最小值
    min_year = df['年'].min()
    max_year = df['年'].max()
    print("年的最小值:", min_year)
    print("年的最大值:", max_year)
    print("---------------------------------------------")

这段代码是用Python编写的，目的是处理指定文件夹中的Excel文件。让我逐步解析：

1. `import os`: 这是Python标准库中的一个模块，提供了许多与操作系统交互的函数。

2. `import pandas as pd`: 这行代码导入了Pandas库，并将其重命名为`pd`，这是一种约定俗成的做法。

3. `folder_path = r'D:\qixiangshuju\西北降水_气温数据\陕西'`: 定义了一个字符串变量`folder_path`，其中包含要处理的文件夹的路径。`r`前缀表示该字符串是一个原始字符串，用于避免反斜杠`\`被解释为转义字符。

4. `files = [file for file in os.listdir(folder_path) if file.endswith('.xls')]`: 使用列表推导式从指定文件夹中获取所有以`.xls`为后缀的文件名，并将它们存储在列表`files`中。

5. `for file in files:`: 开始一个循环，对`files`列表中的每个文件执行以下操作。

6. `file_path = os.path.join(folder_path, file)`: 使用`os.path.join()`函数将文件夹路径和文件名连接起来，形成完整的文件路径。

7. `df = pd.read_excel(file_path)`: 使用Pandas的`read_excel()`函数读取Excel文件，将其转换为DataFrame（数据表格）对象，并将结果存储在名为`df`的变量中。

8. `print("文件名:", file)`: 打印当前正在处理的文件名。

9. `min_year = df['年'].min()`: 使用DataFrame对象`df`的`min()`方法找到列名为'年'的那一列的最小值，并将结果存储在`min_year`变量中。

10. `max_year = df['年'].max()`: 使用DataFrame对象`df`的`max()`方法找到列名为'年'的那一列的最大值，并将结果存储在`max_year`变量中。

11. `print("年的最小值:", min_year)`: 打印列'年'的最小值。

12. `print("年的最大值:", max_year)`: 打印列'年'的最大值。

13. `print("---------------------------------------------")`: 打印分隔线，用于区分不同文件处理结果。

这段代码的作用是遍历指定文件夹中的所有Excel文件，并针对每个文件打印出文件名以及该文件中年份列（假设列名为'年'）的最小值和最大值。

例如，假设文件夹中有两个Excel文件：`file1.xls`和`file2.xls`，它们包含年份数据。如果`file1.xls`中的年份列的最小值为2000，最大值为2010，而`file2.xls`中的年份列的最小值为1995，最大值为2005，则代码的输出将类似于：

```
文件名: file1.xls
年的最小值: 2000
年的最大值: 2010
---------------------------------------------
文件名: file2.xls
年的最小值: 1995
年的最大值: 2005
---------------------------------------------
```

import os
import pandas as pd

# 设置文件夹路径
folder_path = r'D:\qixiangshuju\西北降水_气温数据\陕西'

# 获取文件夹中所有的.xls文件
files = [file for file in os.listdir(folder_path) if file.endswith('.xls')]

# 循环处理每个文件
for file in files:
file_path = os.path.join(folder_path, file)
# 读取Excel文件
df = pd.read_excel(file_path)
# 打印文件名
print("文件名:", file)
# 打印年这一列的最大值和最小值
min_year = df['年'].min()
max_year = df['年'].max()
print("年的最小值:", min_year)
print("年的最大值:", max_year)
print("---------------------------------------------")