使用时直接调用chunk_file函数,写入对应参数即可。也可以保存为xlsx文件,只需要将chunk.to_csv更改即可。(转自大邓和他的python,仅供学习交流用)
# 将超大型csv文件切割,也可切割xlsx文件
import pandas as pd
def chunk_file(chunksize,csv_file):
# chunksize为块dataframe的体量
# csv_file为原csv
new_csv_prefix = csv_file.split('\\')[-1].split('.')[0]
# 定义计数器和文件编号
count = 0
file_number = 1
# 读取csv文件并拆分成多个小块的DataFrame
for chunk in pd.read_csv(csv_file, chunksize=chunksize):
# 将每块DataFrame保存为一个单独的csv文件
chunk.to_csv(f'{new_csv_prefix}_{file_number}.csv', index=False)
file_number += 1