Python将大的csv文件拆分多个小的csv文件

最新推荐文章于 2024-08-18 14:30:51 发布

weixin_30435261

最新推荐文章于 2024-08-18 14:30:51 发布

阅读量1.9k

点赞数 2

文章标签： python

原文链接：http://www.cnblogs.com/zyt-bg/p/11486993.html

版权

#ecoding=utf-8
import os
import time
# 2019/9/8 将大的csv文件拆分多个小的csv文件

def mkSubFile(lines, head, srcName, sub):
    [des_filename, extname] = os.path.splitext(srcName)
    filename = des_filename + '_' + str(sub) + extname
    print('make file: %s' % filename)
    fout = open(filename, 'w')
    try:
        fout.writelines([head])
        fout.writelines(lines)
        return sub + 1
    finally:
        fout.close()


def splitByLineCount(filename, count):
    fin = open(filename,encoding="utf-8")
    try:
        head = fin.readline()
        buf = []
        sub = 1
        for line in fin:
            buf.append(line)
            if len(buf) == count:
                sub = mkSubFile(buf, head, filename, sub)
                buf = []
        if len(buf) != 0:
            sub = mkSubFile(buf, head, filename, sub)
    finally:
        fin.close()


if __name__ == '__main__':
    begin = time.time()
    splitByLineCount('training-inspur.csv', 1000)#每个小的csv文件存放1000条
    end = time.time()
    print('time is %d seconds ' % (end - begin))