在linux的实际应用中,我们有时候需要对文件进行分割与合并处理,我们可以使用split和paste命令进行此类操作。
split命令
split 是以一个很好的分割工具,它可以将一个文件按行分割出来。(split只能按行分割,如果按列,可以用cut,当然更强大的还是用gawk)。
split的常规用法:
split [OPTION]… [INPUT [PREFIX]
参数 | 含义 |
---|---|
-b | 设置的分割大小值,系统会以此值为单位对文件进行分割 |
-l | 指定分割后的每一个文件包含多少行 |
-d | 指定分割文件使用数字后缀 |
-a | 指定文件名的后缀长度,默认是两位 |
以上几个参数应该是实际用这个命令中最为常用的参数了,我们不妨找几个例子看一下:
这是一个非常简单的文本,下面我们做几个操作验证一下上面的参数,看看上面的结果:
1)将这个文本分割成多个文件,每个文件有4行数据:
命令:split -l 4 test_split
结果:可以看到test_split文件被分成了3个,其中前两个有4行,最后一个只有1行
而且被分割的文件命名默认都是以"x"开头的,然后后面的默认长度是2位,从aa–zz按顺序依次排列。所以我们可以用-a和-d对分割后的文件名进行设置:
2)设置文件名的后缀为4位数:
命令:split -a 4 -l 3 test_split
通过-a参数指定分割后的文件名后缀为4位,
3) 将文件名的后缀设置为数字
上面的实例默认的后缀名都是英文,我想用数字怎么办,参数-d可以满足你。
命令:split -d -l 3 test_split
4)将文件按照指定的大小进行分割
我这里有一个12M大小的日志文件。将其按照6M大小进行分割。如下:
需要注意的时候,-b后面可以直接指定大小的单位,比如2K,3M,6G等等。
paste命令
对很多人来说,可能使用cat命令将多个文本合并到一起会是比较常用的操作。但是cat命令只能用于将第二个文本放到第一个之后,像这样:
这里有两个文档,一个记录了学生的名字,一个是记录了成绩,现在我们想把它们合到一起:
cat也是将两个文档合到一起的常用手段,但是这里不合适:
paste会将多个文档横向整合到一起,如下面:
命令:paste name score
paste会将每个文件相同行的内容合成新的一行,中间用tab键隔开,可以用-d参数修改分隔符。
paste的参数只有两个,但是都比较常用:
参数 | 功能 |
---|---|
-d | 指定使用的分隔符,默认是tab符,\t |
-s | 将文件的内容合并到一行,默认用tab键隔开,同样可以用-d指定 |
需要注意的是:-d参数指定分隔符不能同时用多个,使用多个时只会将第一个作为分隔符,下面这个例子:
可以看到一个冒号和多个冒号是一样的,都是取得第一个冒号作为分隔符。
再来个 -s参数的例子,对一个文件和多个文件都可以操作:
初次写博客!很多地方写的不好,如有大神指点,感激不尽!!