基本结构如下:
awk 'BEGIN{ print "start" } pattern {commands } END {print "end"} '
这三部份是可选的。且脚本通常会被包含在单引号或者双引号中:
[root@localhost test]# cat test.sh| wc -l
6
[root@localhost test]# awk 'BEGIN{ i=0 } { i++ } END { print i }' test.sh
6
[root@localhost test]# awk "BEGIN{ i=0 } { i++ } END { print i }" test.sh
6
awk的工作原理如下:
(1)执行BEGIN {command}
(2)从文件或stdin中读取一行,执行pattern {command}。
重复该过程,直到文件全部被读取完毕。
(3)当读到输入流末尾时,执行END{command}语句块。
这三部份是可选的哈。
如果没有(2)部份,则执行默认的 { print },即打印每一读到的行。
如:
[root@localhost test]# echo -e "line1\nline2" | awk 'BEGIN{print "Start"} {print} END {print "End"}'
Start
line1
line2
End
其中echo 的-e选项,是将\n转换为换行符,请自己man 一下。
[root@localhost test]# echo | awk '{var1="v1"; var2="v2"; var3="v3"; print var1,var2,var3}'
v1 v2 v3
[root@localhost test]# echo | awk '{var1="v1"; var2="v2"; var3="v3"; print var1"-"var2"-"var3}'
v1-v2-v3
{}类似于一个循环,会对文件中的
每一行进行迭代。
awk中的特殊变量:
NR:表示
记录数量,执行过程中对应于当前行号。
NF:表示
字段数量,执行过程中对应于当前的字段数。
$0:包含执行过程中当前行的全部文本内容。
$1:包含
第一个字段的文本内容
$2:包含
第二个字段的文本内容
$(NF-1)包含倒数第二个字段。
例:
[root@localhost test]# cat student.data
NO; Name; Mark
1; lufubo; 98
2; cbiao; 88
[root@localhost test]# awk '{print $2,$3}' student.data
Name; Mark
lufubo; 98
cbiao; 88
统计行数:
[root@localhost test]# cat student.data | wc -l
3
[root@localhost test]# awk 'END{print NR}' student.data
3
awk 的选项
-v:将外部变量传递给awk
例:
[root@localhost test]# VAR=100
[root@localhost test]# echo | awk -v V=$VAR '{print V}'
100
awk用getline读取行:
例
[root@localhost test]# seq 5 | awk 'BEGIN { getline; print "first line", $0} {print $0}'
first line 1
2
3
4
5
awk的过滤:
awk 'NR < 5'行号小于5的行
awk 'NR==1, NR==4'行号在1到4的行
awk '/linux/'包含linux样式的行
awk '!/linux/'不包含linux样式的行
例
[root@localhost test]# seq 5 | awk 'NR < 3 {print $0}'
1
2
[root@localhost test]# seq 5 | awk 'NR==2,NR==3 {print $0}'
2
3
[root@localhost test]# echo -e "linux\nlufubo\n" | awk '/linux/ {print $0}'
linux
[root@localhost test]# echo -e "linux\nlufubo\n" | awk '!/linux/ {print $0}'
lufubo
awk设置字符定界符
默认为空格,通过 -F “delimiter”设置
例
[root@localhost test]# awk -F":" '{print $NF}' /etc/passwd
或
[root@localhost test]# awk 'BEGIN {FS = ":"} {print $NF}' /etc/passwd
从awk中读取命令输出
“command” | getline output;
例
[root@localhost test]# echo | awk '{"grep root /etc/passwd" | getline cmdout; print cmdout}'
root:x:0:0:root:/root:/bin/bash
注意其中的双引号哟~^~
打印处于start_pattern与end_pattern 之间的文本
[root@localhost test]# seq 100 | awk '/34/, /35/'
34
35