awk是一个强大的文本分析工具,其对数据分析并生成报告的能力非常强大。它的处理流程为:将文件逐行读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。
语法
awk [-F field-separator] 'commands' input-file(s)
其中,[-F field-separator]为可选的指定域分隔符,不指定的话默认为空格;commands是需要执行的命令;input-file(s) 是待处理的文件。
awk内置变量
ARGC 命令行参数个数
ARGV 命令行参数排列
ENVIRON 支持队列中系统环境变量的使用
FILENAME awk浏览的文件名
FNR 浏览文件的记录数
FS 设置输入域分隔符,等价于命令行 -F选项
NF 浏览记录的域的个数
NR 已读的记录数
OFS 输出域分隔符
ORS 输出记录分隔符
RS 控制记录分隔符
命令示例
1、查找所有账户,并显示账户名
执行命令cat /etc/passwd |awk -F ':' '{print $1}',如下图所示:
2、查找所有账户及其对应shell,并显示,账户与shell之间以“:”分割
执行命令cat /etc/passwd |awk -F ':' '{print $1":"$7}',如下图所示:
3、显示/etc/passwd的账户和账户对应的shell,而账户与shell之间以逗号分割,而且在所有行添加列名name,shell,在最后一行添加"blue,/bin/nosh"
执行命令cat /etc/passwd |awk -F ':' 'BEGIN {print "name,shell"} {print $1","$7} END {print "blue,/bin/nosh"}',如下图所示:
4、统计/etc/passwd:文件名,每行的行号,每行的列数,对应的完整行内容
执行命令awk -F ':' '{print "filename:" FILENAME ",linenumber:" NR ",columns:" NF ",linecontent:"$0}' /etc/passwd,如下图所示:
5、统计/etc/passwd的账户人数
执行命令awk '{count++;print $0;} END{print "user count is ", count}' /etc/passwd,如下图所示:
6、统计某个文件夹下的文件占用的字节数
执行命令ls -l |awk 'BEGIN {size=0;} {size=size+$5;} END{print "[end]size is ", size}',如下图所示:
7、显示/etc/passwd的账户
执行命令awk -F ':' 'BEGIN {count=0;} {name[count] = $1;count++;}; END{for (i = 0; i < NR; i++) print i, name[i]}' /etc/passwd,如下图所示: