split是用来切分文本文件很好用的一个命令
linux下通过split --help 可以查看到split的用法
split --help
用法:split [选项]... [输入 [前缀]]
将输入内容拆分为固定大小的分片并输出到"前缀aa"、"前缀ab",...;
默认以 1000 行为拆分单位,默认前缀为"x"。如果不指定文件,或
者文件为"-",则从标准输入读取数据。
长选项必须使用的参数对于短选项时也是必需使用的。
-a, --suffix-length=N 指定后缀长度为N (默认为2)
-b, --bytes=大小 指定每个输出文件的字节大小
-C, --line-bytes=大小 指定每个输出文件里最大行字节大小
-d, --numeric-suffixes 使用数字后缀代替字母后缀
-l, --lines=数值 指定每个输出文件有多少行
--verbose 在每个输出文件打开前输出文件特征
--help 显示此帮助信息并退出
--version 显示版本信息并退出
SIZE 可以是一个可选的整数,后面跟着以下单位中的一个:
KB 1000,K 1024,MB 1000*1000,M 1024*1024,还有 G、T、P、E、Z、Y。
示例:
split 1.txt --suffix-length=4 --lines=1000 --numeric-suffixes ./urls.
该命令将1.txt 切分,每个文件为1000行,后缀长度为4,使用数字后缀(默认为字母后缀), 文件在当前目录下,文件名前缀为urls.
即切分后的文件名字为urls.0000 urls.0001 urls.0002 。