使用python对csv文件进行拆分

背景是在工作中,需要给业务方提供一堆明细数据,从数据库里取出来的明细数据超过csv文件打开的上限了,业务方没法用,所以就需要对其进行拆分

python读写csv文件测试

先配置相关包并定义一个结果文件的存储路径

import csv
import os

#创建csv文件并写入指定内容
#定义结果文件的生成路径
result_path = 'D:\Python_Project\CSV文件拆分\结果文件'

往csv文件写入数据的时候有两种方式,writerowwriterows

#writerow
with open(result_path + '\三国.csv','w', newline='') as file:
    writer = csv.writer(file) # csv.writer()函数用于创建一个writer对象
    writer.writerow(["刘备", "玄德", "蜀"]) # writer.writerow()然后使用该函数将单行写入 CSV 文件
    writer.writerow(["曹操", "孟德", "魏"])
    writer.writerow(["孙权", "仲谋", "吴"])
    writer.writerow(["董卓", "仲颖", "其它"])

一行一行的往里面添加,结果如下图
在这里插入图片描述

#writerows
list = [["关羽", "云长", "蜀"],
        ["夏侯惇", "元让", "魏"],
        ["甘宁", "兴霸", "吴"],
        ["吕布", "奉先", "其他"]]
with open(result_path + '\三国.csv','a', newline='') as file: #a表示追加内容
    writer = csv.writer(file)
    writer.writerows(list)

writerows则是准备一个列表,一次直接插入,结果如下图
在这里插入图片描述

准备一个需要切分的csv文件

新建一个csv文件,并直接准备10000行,后续每1000行拆分1次
在这里插入图片描述
确定输入文件路径和输出文件路径,其中i是文件的第i行,j是用来表示第j个输出的文件

#准备10000行的csv作为样例,进行拆分
example_path = 'D:\Python_Project\CSV文件拆分\example.csv' # 需要拆分文件的路径
example_result_dir = 'D:\Python_Project\CSV文件拆分' # 拆分后文件的路径

with open(example_path, 'r', newline='') as example_file:
    example = csv.reader(example_file)
    i = j = 1
    for row in example:
        print(row)
        print(f'i 等于 {i}, j 等于 {j}')
        # 每1000个就j加1, 然后就有一个新的文件名
        if i % 1000 == 0:
            j += 1
            print(f'第{j}个文件生成完成')
        example_result_path = example_result_dir + '\example_result' + str(j) + '.csv'
        print(example_result_path)

对于没有输出文件的情况,就新创建一个

# 不存在此文件的时候,就创建
        if not os.path.exists(example_result_path):
            with open(example_result_path, 'w', newline='') as file:
                csvwriter = csv.writer(file)
                csvwriter.writerow(['这是一个表头'])
                csvwriter.writerow(row)
            i += 1

如果存在输出文件的话,则直接追加内容

# 存在的时候就往里面添加
        else:
            with open(example_result_path, 'a', newline='') as file:
                csvwriter = csv.writer(file)
                csvwriter.writerow(row)
            i += 1

输出结果如下
在这里插入图片描述
完整代码如下:

import csv
import os

#创建csv文件并写入指定内容
#定义结果文件的生成路径
result_path = 'D:\Python_Project\CSV文件拆分\结果文件'

#writerow
with open(result_path + '\三国.csv','w', newline='') as file:
    writer = csv.writer(file) # csv.writer()函数用于创建一个writer对象
    writer.writerow(["刘备", "玄德", "蜀"]) # writer.writerow()然后使用该函数将单行写入 CSV 文件
    writer.writerow(["曹操", "孟德", "魏"])
    writer.writerow(["孙权", "仲谋", "吴"])
    writer.writerow(["董卓", "仲颖", "其它"])

#writerows
list = [["关羽", "云长", "蜀"],
        ["夏侯惇", "元让", "魏"],
        ["甘宁", "兴霸", "吴"],
        ["吕布", "奉先", "其他"]]
with open(result_path + '\三国.csv','a', newline='') as file: #a表示追加内容
    writer = csv.writer(file)
    writer.writerows(list)

#准备10000行的csv作为样例,进行拆分
example_path = 'D:\Python_Project\CSV文件拆分\example.csv' # 需要拆分文件的路径
example_result_dir = 'D:\Python_Project\CSV文件拆分' # 拆分后文件的路径

with open(example_path, 'r', newline='') as example_file:
    example = csv.reader(example_file)
    i = j = 1
    for row in example:
        print(row)
        print(f'i 等于 {i}, j 等于 {j}')
        # 每1000个就j加1, 然后就有一个新的文件名
        if i % 1000 == 0:
            j += 1
            print(f'第{j}个文件生成完成')
        example_result_path = example_result_dir + '\example_result' + str(j) + '.csv'
        print(example_result_path)

        # 不存在此文件的时候,就创建
        if not os.path.exists(example_result_path):
            with open(example_result_path, 'w', newline='') as file:
                csvwriter = csv.writer(file)
                csvwriter.writerow(['这是一个表头'])
                csvwriter.writerow(row)
            i += 1

        # 存在的时候就往里面添加
        else:
            with open(example_result_path, 'a', newline='') as file:
                csvwriter = csv.writer(file)
                csvwriter.writerow(row)
            i += 1

20220909更新了相同功能的另一套逻辑,运行时间从1小时变为2分钟,使用python中的pandas对csv文件进行拆分

  • 12
    点赞
  • 46
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
Python可以使用csv模块来拆分CSV文件。你可以按照以下步骤来完成拆分操作: 1. 首先,导入csv模块。 2. 打开原始CSV文件并创建一个csv.reader对象。 3. 创建一个新的CSV文件,用于存储拆分后的数据。 4. 使用for循环遍历原始CSV文件中的每一行数据。 5. 根据你的需求,决定如何拆分数据。你可以根据行数、列数、特定条件等进行拆分。 6. 将拆分后的数据写入新的CSV文件中。 7. 关闭原始CSV文件和新的CSV文件。 以下是一个示例代码片段,演示了如何使用Python拆分CSV文件: ```python import csv def split_csv(input_file, output_file_prefix, chunk_size): with open(input_file, 'r') as file: reader = csv.reader(file) header = next(reader) # 读取CSV文件的表头 row_count = 0 file_count = 1 output_file = f"{output_file_prefix}_{file_count}.csv" with open(output_file, 'w', newline='') as output: writer = csv.writer(output) writer.writerow(header) # 写入表头 for row in reader: writer.writerow(row) row_count += 1 if row_count >= chunk_size: row_count = 0 file_count += 1 output_file = f"{output_file_prefix}_{file_count}.csv" output.close() output = open(output_file, 'w', newline='') writer = csv.writer(output) writer.writerow(header) # 写入表头 output.close() # 使用示例 input_file = 'input.csv' # 输入的CSV文件 output_file_prefix = 'output' # 拆分后的CSV文件名前缀 chunk_size = 1000 # 每个拆分文件的行数 split_csv(input_file, output_file_prefix, chunk_size) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

孟意昶

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值