在日常的数据处理工作中,很多时候我们会遇到一个包含多个工作表(Sheet)的 Excel 文件,可能需要将每个工作表分别保存为独立的 Excel 文件。手动进行这种操作非常繁琐且易出错,但借助 Python 中的 pandas
库,我们可以非常方便地自动化这个过程。
在这篇博文中,我们将介绍如何使用 Python 将一个 Excel 文件中的每个工作表(Sheet)保存成单独的 Excel 文件。
1. 使用 pandas
库进行操作
除了 openpyxl
,pandas
库也可以用来处理 Excel 文件。pandas
提供了非常简便的读取和写入 Excel 文件的方法,特别适合需要处理大量数据的场景。
2.1 安装 pandas
和 openpyxl
pandas
需要依赖 openpyxl
来处理 .xlsx
格式的文件。如果没有安装,可以通过以下命令一起安装:
pip install pandas openpyxl
2.2 代码实现
使用 pandas
来实现将 Excel 文件中的每个工作表保存为单独的文件的代码如下:
import pandas as pd
def split_excel_sheet(input_file):
# 读取 Excel 文件中的所有工作表
xls = pd.ExcelFile(input_file)
# 遍历每个工作表