1.cut 简介
cut是一个选取命令,就是将一段数据经过分析,Linux和Unix中取出我们想要的。
一般来说,选取信息通常是针对“行”来进行分析的,并不是整篇信息分析的。
2. cut命令和语法
2.1 语法格式
cut [-bn] [file] 或
cut [-c] [file] 或
cut [-df] [file]
说明:
cut 命令从文件的每一行剪切字节、字符和字段并将这些字节、字符和字段写至标准输出。
如果不指定 File 参数,cut 命令将读取标准输入。必须指定 -b、-c 或 -f 标志之一。
2.2 主要参数介绍
-b :以字节为单位进行分割。这些字节位置将忽略多字节字符边界,除非也指定了 -n 标志。
-c :以字符为单位进行分割。
-d :自定义分隔符,默认为制表符。
-f :与-d一起使用,指定显示哪个区域。
-n :取消分割多字节字符。仅和 -b 标志一起使用。如果字符的最后一个字节落在由 -b 标志的 List 参数指示的
范围之内,该字符将被写出;否则,该字符将被排除。
cut 命令常用于三个参数:
第一,字节(bytes),用选项-b
第二,字符(characters),用选项-c
第三,域(fields),用选项-f
2.3 实例探究
说明
以context.txt 文本文件和/etc/passwd为例
$ cat content.txt
Ubuntu Linux
Microsoft Windows
OsX El Capitan
Unix
FreeBSD
1 指定分隔符
最常用的选项是 -d 和 -f 的组合,这会根据 -d 指定的分隔符和 -f 列出的字段来提取内容
- 例如在这个例子中只打印出 /etc/passwd 文件每一行的第一个字段,用的分隔符是 :
nian@ubuntu:~/shell/sct$ cut -d':' -f1 /etc/passwd
root
daemon
bin
sys
sync
games
man
lp
mail
news
uucp
proxy
www-data
backup
list
irc
gnats
...
- 在下面这个例子中我们用空格作为分隔符打印 content.txt 文件的第一个字段
nian@ubuntu:~/shell/sct$ cut -d " " -f 1 content.txt
Ubuntu
Microsoft
OsX
Unix
FreeBSD
- 在下面这个例子中我们提取了多个字段。这里,我们使用冒号(:)分隔符从文件 /etc/passwd 中包含字符串 /bin/bash 的行提取第一和第六个字段
nian@ubuntu:~/shell/sct$ grep "/bin/bash" /etc/passwd | cut -d':' -f1,6
root:/root
nian:/home/nian
- 要显示字段的某个范围,可以指定开始和结束的字段,中间用连字符(-)连接,如下所示:
nian@ubuntu:~/shell/sct$ grep "/bin/bash" /etc/passwd | cut -d':' -f1-4,6,7
root:x:0:0:/root:/bin/bash
nian:x:1000:1000:/home/nian:/bin/bash
2 以字符的方式提取内容
-c 选项可以用来根据字符位置进行提取,注意空格和Tab也以字符来处理。
- 打印 context.txt 文件每一行的第一个字符,如下:
nian@ubuntu:~/shell/sct$ cut -c 1 content.txt
U
M
O
U
F
- 下面显示了 context.txt 文件每一行的第一至七个字符;
nian@ubuntu:~/shell/sct$ cut -c 1-7 content.txt
Ubuntu
Microso
OsX El
Unix
FreeBSD
- 我们再测试一下只指定开始或结束的位置。下面提取第二个到最后一个字符:
nian@ubuntu:~/shell/sct$ cut -c 2- content.txt
buntu Linux
icrosoft Windows
sX El Capitan
nix
reeBSD
- 提取第一到第四个字符:
nian@ubuntu:~/shell/sct$ cut -c-4 content.txt
Ubun
Micr
OsX
Unix
Free
3 以字节方式提取
使用-b选项通过指定字节的位置来选择一行的某一部分,使用逗号分隔每个指定位置,或用连字符 - 指定一个范围。
- 下面这个例子提取 content.txt 文件每一行的第一,二,三个字节:
nian@ubuntu:~/shell/sct$ cut -b 1,2,3 content.txt
Ubu
Mic
OsX
Uni
Fre
- 我们也可以用如下命令列出一个范围;
nian@ubuntu:~/shell/sct$ cut -b 1-3,5-7 content.txt
Ubutu
Micoso
OsXEl
Uni
FreBSD
3. 常用实例
cut 是一个实用的命令,常常和其他Linux或Unix命令结合使用。
- 例如如果你想提取 ps 命令中的 USER,PID和COMMAND:
nian@ubuntu:~/shell/sct$ ps -L u n | tr -s " " | cut -d " " -f 2,3,14-
USER PID COMMAND
1000 3030 bash
1000 3755 dos2unix
1000 3894 bash
1000 4940 vim getopts1/sh
1000 5639 bash
1000 7373 ps -L u n
1000 7374 tr -s
1000 7375 cut -d -f 2,3,14-
- 提取内存的 total,used和free值,并保存到一个文件中。
nian@ubuntu:~/shell/sct$ free -m | tr -s ' ' | sed '/^Mem/!d' | cut -d" " -f2-4 >> memory.txt
nian@ubuntu:~/shell/sct$ cat memory.txt
1970 716 317
4. 总结
- cut 命令可以和很多其他Linux或Unix命令通过管道连接。可以通过管道传递一个或多个过滤器进行额外的文本处理。
- cut的不足之处在处理多空格时。
如果文件里面的某些域是由若干个空格来间隔的,那么用cut就有点麻烦了,因为cut只擅长处理“以一个字符间隔”的文本内容
参考博客:
1.https://blog.csdn.net/yychuyu/article/details/107472229
2.https://www.cnblogs.com/liuling/p/2013-12-08.html