linux按行分割文件,按行切割大文件(linux split 命令简版)

按行切割大文件(linux split 命令简版)

#-*- coding:utf-8 -*-

__author__ = ‘KnowLifeDeath‘

‘‘‘

Linux上Split命令可以方便对大文件进行分割,该PY脚本是在Windows上按指定行数切割文件

Python Version: 2.7

‘‘‘

import time

import sys

print time.strftime(‘%Y-%m-%d %H:%M:%S‘, time.localtime(time.time()))

‘‘‘需要初始化参数‘‘‘

BigFile = "E:\Data\Big.txt"

OneUnitEnd = 1000000 #分割块行数

ZeroFillWidth = 3 #zfill参数是小文件的序号编码长度

seed = 0 #当前块的计数

UnitNo = 0 #当前块序号

fSmallFile = open(‘{0}\Samll{1}.txt‘.format(sys.path[0], ‘0‘.zfill(ZeroFillWidth)),‘w‘)

fBigFile = open(BigFile)

for line in fBigFile:

rawLineData = line.strip(‘\n‘).strip()

if len(rawLineData) != 0:

seed +=1

fSmallFile.write(‘{0}\n‘.format(rawLineData))

if seed == OneUnitEnd:

fSmallFile.close()

seed = 0

UnitNo += 1

fSmallFile = open(‘{0}\\Samll{1}.txt‘.format(sys.path[0], str(UnitNo).zfill(ZeroFillWidth)), ‘w‘)

#最后一个small文件可能是空文件(整分时)

#a/w模式速度区别不大,亿级数据都是1分半到2分之间搞定

#close多次不会有问题

fSmallFile.close()

print time.strftime(‘%Y-%m-%d %H:%M:%S‘, time.localtime(time.time()))

原文:http://www.cnblogs.com/know-life-death/p/6362072.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值