python拆分大文件(大文件分割)

python拆分大文件

前言

在工作中常常会遇见一些大文件,由于内容太多,使用比如记事本、notePad++等软件也打不开,无法查看内容,最好是将整个文件进行拆分,分开处理,现在处理的文件原本是5个G的大文件,最后拆分成了28个小文件。

实现过程

# -*- coding:utf-8 -*-
def Main_split():
    source = 'C:\\Users\\Desktop\\proc_create_20210228\\proc_create_20210228.json'
    # 此处一定要建上target文件夹,不然会报路径错误
    target = 'C:\\Users\\Desktop\\proc_create_20210228\\target\\'
    # 文件的行数的计数器
    num = 0
    # 文件序号
    name_num = 1
    # 用于存放数据
    dataStore = []
    
    # 设置为UTF-8编码
    with open(source, 'r', encoding='UTF-8') as file_content:
        for line in file_content:
            num += 1
            dataStore.append(line)
            # 设定每个文件为20万行
            if num == 200000:
                with open(target + "target_list_" + str(name_num) + ".json", 'w+') as file_target:
                    for data in dataStore:
                        file_target.write(data)
                name_num += 1
                num = 0
                dataStore = []

    # 处理最后一个文件,如果最后一个文件行数少于20万行,进行如下处理
    with open(target + "target_list_" + str(name_num) + ".json", 'w+') as file_target:
        for data in dataStore:
            file_target.write(data)


if __name__ == "__main__":
    Main_split()

实验结果

在这里插入图片描述

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值