awk 也是流式编辑器,针对文档中的行来操作,一行一行地执行。 awk 兼具 sed 的所有功能,而且更加强大。 awk 工具其实是很复杂的,对于初学者来说,只要能处理日常管理工作中的问题即可
准备
[root@evan-01 sed]# mkdir awk
[root@evan-01 sed]# cd awk
[root@evan-01 awk]# cp /etc/passwd test.txt
[root@evan-01 awk]# ls
test.txt
[root@evan-01 awk]#
截取文档中的某个段
[root@evan-01 awk]# head -n2 test.txt
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
[root@evan-01 awk]#
打印某个段
[root@evan-01 awk]# head -n2 test.txt | awk -F ':' '{print $1}'
root
bin
[root@evan-01 awk]#
本例中,-F 选项的作用是指定分隔符。如果不加 -F 选项,则以空格或者 tab 为分隔符。 print 为打印的动作,用来打印某个字段。$1 为第一个字段,$2 为第二个字段,依次类推。但 $0 比较特殊,它表示整行,没说明要打印几行的话,就是全部
打印整行
[root@evan-01 awk]# head -n2 test.txt | awk -F ':' '{print $0}'
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
[root@evan-01 awk]#
打印全部
[root@evan-01 awk]# awk '{print $0}' test.txt
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin
games:x:12:100:games:/usr/games:/sbin/nologin
ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin
nobody:x:99:99:Nobody:/:/sbin/nologin
systemd-network:x:192:192:systemd Network Management:/:/sbin/nologin
dbus:x:81:81:System message bus:/:/sbin/nologin
polkitd:x:999:997:User for polkitd:/:/sbin/nologin
postfix:x:89:89::/var/spool/postfix:/sbin/nologin
sshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin
chrony:x:998:996::/var/lib/chrony:/sbin/nologin
evan1:x:1000:1000::/home/evan1:/bin/bash
evan2:x:1001:1001::/home/evan2:/bin/bash
user1:x:1002:1002::/home/user1:/bin/bash
user2:x:1004:1005::/home/user2:/bin/bash
user3:x:1006:1005::/home/user3:/sbin/nologin
user4:x:1007:1007::/home/user4:/bin/bash
rpc:x:32:32:Rpcbind Daemon:/var/lib/rpcbind:/sbin/nologin
rpcuser:x:29:29:RPC Service User:/var/lib/nfs:/sbin/nologin
nfsnobody:x:65534:65534:Anonymous NFS User:/var/lib/nfs:/sbin/nologin
[root@evan-01 awk]#
不加分隔符
[root@evan-01 awk]# vi 1.txt
写入以下内容,并保存
[root@evan-01 awk]# awk '{print $1}' 1.txt
1
aa
[root@evan-01 awk]#
打印多个字段
[root@evan-01 awk]# head -n2 test.txt | awk -F ':' '{print $1,$3,$5}'
root 0 root
bin 1 bin
[root@evan-01 awk]#
awk 的格式,-F 后面紧跟单引号,单引号里面为分隔符。print 的动作要用 {} 括起来,否则会报错。print 还可以打印自定义的内容,但是自定义的内容要用双引号括起来
指定分隔符打印多个字段
[root@evan-01 awk]# head -n2 test.txt | awk -F ':' '{print $1"#"$3"#"$5}'
root#0#root
bin#1#bin
[root@evan-01 awk]#
匹配字符或者字符串
匹配字符
[root@evan-01 awk]# awk '/oo/' test.txt
root:x:0:0:root:/root:/bin/bash
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin
postfix:x:89:89::/var/spool/postfix:/sbin/nologin
[root@evan-01 awk]#
这跟 sed 的用法类似,能实现 grep 的功能,但没有颜色显示,肯定没有 grep 用起来方便。不过 awk 还有比 sed 更加强大的匹配
匹配精确到行的字符
[root@evan-01 awk]# awk -F ':' '$1 ~ /oo/' test.txt
root:x:0:0:root:/root:/bin/bash
[root@evan-01 awk]#
里面还可以用正则,不需要脱义
[root@evan-01 awk]# awk -F ':' '$1 ~ /o+/' test.txt
root:x:0:0:root:/root:/bin/bash
daemon:x:2:2:daemon:/sbin:/sbin/nologin
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
operator:x:11:0:operator:/root:/sbin/nologin
nobody:x:99:99:Nobody:/:/sbin/nologin
systemd-network:x:192:192:systemd Network Management:/:/sbin/nologin
polkitd:x:999:997:User for polkitd:/:/sbin/nologin
postfix:x:89:89::/var/spool/postfix:/sbin/nologin
chrony:x:998:996::/var/lib/chrony:/sbin/nologin
nfsnobody:x:65534:65534:Anonymous NFS User:/var/lib/nfs:/sbin/nologin
[root@evan-01 awk]#
它可以让某个段去匹配,这里的 ~ 就是匹配的意思。 awk 还可以多次匹配
多次匹配
[root@evan-01 awk]# awk -F ':' '/root/ {print $1,$3} /user/ {print $1,$3}' test.txt
root 0
operator 11
user1 1002
user2 1004
user3 1006
user4 1007
rpcuser 29
[root@evan-01 awk]#
貌似没看到第二行的 root 在哪儿,用 grep 查看下
[root@evan-01 awk]# grep -E 'root|user' test.txt
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
user1:x:1002:1002::/home/user1:/bin/bash
user2:x:1004:1005::/home/user2:/bin/bash
user3:x:1006:1005::/home/user3:/sbin/nologin
user4:x:1007:1007::/home/user4:/bin/bash
rpcuser:x:29:29:RPC Service User:/var/lib/nfs:/sbin/nologin
[root@evan-01 awk]#
还可以这样写
[root@evan-01 awk]# awk -F ':' '/root|user/ {print $1,$3}' test.txt
root 0
operator 11
user1 1002
user2 1004
user3 1006
user4 1007
rpcuser 29
[root@evan-01 awk]#
条件操作符
== 等于
[root@evan-01 awk]# awk -F ':' '$3=="0"' test.txt
root:x:0:0:root:/root:/bin/bash
[root@evan-01 awk]#
awk 中可以用逻辑符号进行判断,比如 == 就是等于,也可以理解为精准匹配。另外还有 >、>=、<、<=、!= 等。值得注意的是,在和数字比较时,若把比较的数字用双引号引起来,那么 awk 不会认为是数字,而会认为是字符,不加双引号则会认为是数字
还可以给打印出来
[root@evan-01 awk]# awk -F ':' '$3=="0" {print $1}' test.txt
root
[root@evan-01 awk]#
>= 大于等于
[root@evan-01 awk]# awk -F ':' '$3>="1000" {print $3}' test.txt
2
3
4
5
6
7
8
11
12
14
99
192
81
999
89
74
998
1000
1001
1002
1004
1006
1007
32
29
65534
[root@evan-01 awk]#
我们明明是想把 大于1000 的列出来,现在是什么?现在就是按阿斯码排的,为什么呢,因为1000加了双引号,被识别为字符串了
去掉双引号试试
[root@evan-01 awk]# awk -F ':' '$3>=1000 {print $3}' test.txt
1000
1001
1002
1004
1006
1007
65534
[root@evan-01 awk]#
!= 不等于
[root@evan-01 awk]# awk -F ':' '$7!="/sbin/nologin" {print $0}' test.txt
root:x:0:0:root:/root:/bin/bash
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
evan1:x:1000:1000::/home/evan1:/bin/bash
evan2:x:1001:1001::/home/evan2:/bin/bash
user1:x:1002:1002::/home/user1:/bin/bash
user2:x:1004:1005::/home/user2:/bin/bash
user4:x:1007:1007::/home/user4:/bin/bash
[root@evan-01 awk]#