今天需要把一个2百万的号码文件按行分割成500/个的小文件,当然用linux来做很方便:
首选split:
我的版本支持按行分割:
-d参数指定了分割后的文件用数字来命名,并用fg作为前缀,如果不用-d参数,则会生成xaa,xab这样的字母名。如果不指定前缀,则会用x作为默认前缀。
其次用awk,这个是我比较熟悉的方法:
当然windows下还可以用批处理来实现:
忽略空行
保留空行
本文和[url]http://www.cn-dos.net/forum/viewthread.php?tid=41471[/url]完全相同,我搜索批处理方法的时候找到的。自己也记录一下,现在的记忆力越来越不好了。
首选split:
# split --version
split (coreutils) 5.2.1
Written by Torbjorn Granlund and Richard M. Stallman.
我的版本支持按行分割:
split -l 500 m.txt -d fg
-d参数指定了分割后的文件用数字来命名,并用fg作为前缀,如果不用-d参数,则会生成xaa,xab这样的字母名。如果不指定前缀,则会用x作为默认前缀。
其次用awk,这个是我比较熟悉的方法:
gawk '{i=int((NR-1)/500)+1;{print $0>>"fg_"i".txt"}}' m.txt
当然windows下还可以用批处理来实现:
忽略空行
@echo off & setlocal enabledelayedexpansion
set m=1
for /f "delims=" %%a in (a.txt) do (
if !n! GEQ 100 set n=0 & set/a m+=1
echo %%a>>a_!m!.txt
set/a n+=1
)
保留空行
@echo off & setlocal enabledelayedexpansion
set m=1
for /f "delims=" %%a in ('findstr /n .* a.txt') do (
if !n! GEQ 100 set n=0 & set/a m+=1
for /f "tokens=1* delims=:" %%i in ("%%a") do echo.%%j>>a_!m!.txt
set/a n+=1
)
本文和[url]http://www.cn-dos.net/forum/viewthread.php?tid=41471[/url]完全相同,我搜索批处理方法的时候找到的。自己也记录一下,现在的记忆力越来越不好了。