import os
import pandas as pd
# 设置文件夹路径
folder_path = r'D:\qixiangshuju\甘肃'
# 获取文件夹中所有的.xls文件
files = [file for file in os.listdir(folder_path) if file.endswith('.xls')]
# 循环处理每个文件
for file in files:
file_path = os.path.join(folder_path, file)
# 读取Excel文件
df = pd.read_excel(file_path)
# 提取年份列的最小值和最大值
min_year = df['年'].min()
max_year = df['年'].max()
# 构建新的文件名
new_file_name = f"{file}_{min_year}_{max_year}.xls"
# 构建新文件的路径
new_file_path = os.path.join(folder_path, new_file_name)
# 修改文件名
os.rename(file_path, new_file_path)
这段代码是一个 Python 脚本,主要用于处理指定文件夹中的 Excel 文件。让我逐行解析并举例说明每行代码的功能:
1. `import os`: 导入 Python 中用于操作文件和文件夹的模块。
2. `import pandas as pd`: 导入 Pandas 库,Pandas 是 Python 中用于数据处理和分析的重要库。
3. `folder_path = r'D:\qixiangshuju\甘肃'`: 设置文件夹路径,这里是指定的文件夹路径,应该包含要处理的 Excel 文件。
4. `files = [file for file in os.listdir(folder_path) if file.endswith('.xls')]`: 使用列表推导式获取文件夹中所有以 `.xls` 结尾的文件名,并存储在 `files` 列表中。
5. `for file in files:`: 循环遍历 `files` 列表中的每个文件。
6. `file_path = os.path.join(folder_path, file)`: 构建当前文件的完整路径,使用 `os.path.join()` 函数来保证路径的正确拼接。
7. `df = pd.read_excel(file_path)`: 使用 Pandas 的 `read_excel()` 函数读取 Excel 文件,将其内容存储在 DataFrame 中,这里将 DataFrame 命名为 `df`。
8. `min_year = df['年'].min()`: 在 DataFrame 中选择 '年' 这一列,并使用 `min()` 函数找到该列的最小值,即年份的最小值。
9. `max_year = df['年'].max()`: 在 DataFrame 中选择 '年' 这一列,并使用 `max()` 函数找到该列的最大值,即年份的最大值。
10. `new_file_name = f"{file}_{min_year}_{max_year}.xls"`: 构建新的文件名,格式为原文件名加上最小年份和最大年份,用下划线分隔。
11. `new_file_path = os.path.join(folder_path, new_file_name)`: 构建新文件的完整路径,同样使用 `os.path.join()` 函数。
12. `os.rename(file_path, new_file_path)`: 使用 `os.rename()` 函数重命名文件,将原文件名修改为新的文件名。
举例说明:
假设文件夹中有两个 Excel 文件,分别是 `data1.xls` 和 `data2.xls`,它们的年份分别是 2010 到 2020 年,和 2005 到 2015 年。执行这段代码后,文件夹中的文件将会被重命名为:
- `data1.xls_2010_2020.xls`
- `data2.xls_2005_2015.xls`
这样,文件名中就包含了对应 Excel 文件中年份的范围。
import os
import pandas as pd
# 设置文件夹路径
folder_path = r'D:\qixiangshuju\甘肃'
# 获取文件夹中所有的.xls文件
files = [file for file in os.listdir(folder_path) if file.endswith('.xls')]
# 循环处理每个文件
for file in files:
file_path = os.path.join(folder_path, file)
# 读取Excel文件
df = pd.read_excel(file_path)
# 提取年份列的最小值和最大值
min_year = df['年'].min()
max_year = df['年'].max()
# 构建新的文件名
new_file_name = f"{file}_{min_year}_{max_year}.xls"
# 构建新文件的路径
new_file_path = os.path.join(folder_path, new_file_name)
# 修改文件名
os.rename(file_path, new_file_path)