将一个Excel文件中的数据每1000条划分为一个新的Excel文件

爱吃山竹的大肚肚

于 2024-11-25 17:54:15 发布

阅读量587

点赞数 10

分类专栏： python 文章标签： excel python

本文链接：https://blog.csdn.net/qq_45873770/article/details/144033405

版权

python 专栏收录该内容

1 篇文章

订阅专栏

要将一个Excel文件中的数据每1000条划分为一个新的Excel文件，最后剩余的数据（不足1000条）也保留为一个新的Excel文件，可以使用Python的pandas库来实现。pandas支持高效的数据处理和Excel文件的读取/写入。下面是一个完整的示例代码，演示了如何实现这个需求：

安装依赖

首先确保安装了pandas和openpyxl，后者是pandas用来处理Excel文件的引擎：

pip install pandas openpyxl

示例代码

import pandas as pd

# 读取原始 Excel 文件
input_file = 'input.xlsx'  # 需要替换为你的文件路径
df = pd.read_excel(input_file)

# 定义每个新文件的最大行数
chunk_size = 1000

# 计算需要分成多少个文件
num_chunks = len(df) // chunk_size + (1 if len(df) % chunk_size != 0 else 0)

# 分割数据并保存到多个新文件中
for i in range(num_chunks):
    start_row = i * chunk_size
    end_row = (i + 1) * chunk_size
    
    # 获取当前块的数据
    chunk_df = df.iloc[start_row:end_row]
    
    # 保存为新的 Excel 文件
    output_file = f'output_{i + 1}.xlsx'
    chunk_df.to_excel(output_file, index=False, engine='openpyxl')
    print(f'已保存: {output_file}')

print('分割完成！')

代码解析

读取Excel文件：
- 使用 pandas.read_excel() 函数读取原始Excel文件，假设文件名为 input.xlsx。你可以根据需要修改文件路径。
定义分割大小：
- chunk_size = 1000 设置每个Excel文件的最大行数。
计算需要分割成多少个文件：
- 计算总行数，并根据每个文件的大小（1000行）来确定需要分成多少个文件。通过 len(df) // chunk_size 计算完整的1000行块，剩余部分用 (1 if len(df) % chunk_size != 0 else 0) 来处理。
分割数据并保存：
- 使用 iloc[start_row:end_row] 获取每一块数据，并用 to_excel() 保存为新的Excel文件。文件名使用 output_1.xlsx, output_2.xlsx 等，自动编号。
输出文件名：
- 每次保存时打印出文件名，确认分割结果。