1、简介
awk 是一种处理文本文件的语言,强大的文本分析工具。还是一种编程语言。
awk 是以文件的一行内容为处理单位的。awk读取一行内容,然后根据指定条件判断是否处理此行内容,若此行文本符合条件,则执行脚本,否则跳过此行文本,读取下一行进行判断。
2、变量
默认情况下,awk 会将如下变量分配给它在文本行中发现的数据字段(即一列):
$0 代表整个文本行;
$1 代表文本行中的第 1 个数据字段;
$2 代表文本行中的第 2 个数据字段;
$n 代表文本行中的第 n 个数据字段。
所以在下面的例子中,awk 程序读取文本文件,只显示第 1 个数据字段的值:
[root@localhost ~]# cat test1.txt
One line of test text.
Two lines of test text.
Three lines of test text.
[root@localhost ~]# awk '{print $1}' test1.txt
One
Two
Three
3、awk读取文件
awk 允许将脚本命令存储到文件中,然后再在命令行中引用。例子如下:
awk.sh
[root@localhost ~]# cat awk.sh
{print $1 "'s home directory is " $6}
[root@localhost ~]# awk -F: -f awk.sh /etc/passwd
root's home directory is /root
bin's home directory is /bin
...
user's home directory is /home/user
4、awk BEGIN关键字
默认情况下,awk 会从输入中读取一行文本,然后对该行的数据执行程序脚本。BEGIN 关键字是在处理数据前运行脚本命令。例子如下:
[root@localhost ~]# cat test2.txt
Line 1
Line 2
Line 3
[root@localhost ~]# awk 'BEGIN {print "The test2File:"}
> {print $0}' test2.txt
The test2 File:
Line 1
Line 2
Line 3
5、awk END关键字
和 BEGIN 关键字相对应,END 关键字允许我们在读完数据后执行一些脚本命令。例子如下:
[root@localhost ~]# awk 'BEGIN {print "The test3File:"}
> {print $0}
> END {print "End of File"}' test3.txt
The testFile:
Line 1
Line 2
Line 3
End of File