awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。awk有3个不同版本: awk、nawk和gawk,在Linux上,我们通常使用GUN awk,简称gawk。awk其名称得自于它的创始人 Alfred Aho 、Peter Weinberger 和 Brian Kernighan 姓氏的首个字母。
1.基本用法
awk[OPTIONS] ‘program’ FILE1 FILE2…
其中program:PATTERN{ACTION STATEMENT}
program:编程语言
PATTERN:模式
ACTION STATEMENT:动作语句,可以由多个语句组成,各个语句之间用分号分隔;如print,printf
OPTIONS:-F[]:指明输入字段分隔符;
-v VAR_NAME=VALUE:变量赋值;
-f /PATH/FROM/AWK_SCRIPT
2.awk的输出命令之一:print
print格式:print item1,item2,…
item:字符串,用引号引用;print “hello”,“world”
变量:显示变量的值,可以直接使用变量的名进行引用;print name
要点:(1)各item之间使用逗号分隔,输出时的分隔符默认为空白字符;
(2)输出的各item可以字符串,也可以是数值;当前记录的字段、变量或awk的表达式
(3)item省略时,相当于print $0
(4)输出空白字符:print “ ”
3.awk内置变量
变量名
属性
$0
当前记录
1 − 1- 1−n
当前记录的第n个字段
FS
输入字段分隔符,默认为空白字符
OFS
输出字段分隔符,默认为空白字符
RS
输入记录分隔符,默认为换行符
ORS
输出记录分隔符,默认为换行符
NF
当前记录中的字段个数,就是有多少列
NR
已经读出的记录数,就是行号,从1开始
FNR
行数,各文件单独计数
FILENMAME
当前正被awk读取的文件的文件名
ARGC
awk命令行中参数的个数
ARGV
数组,保存了命令行参数本身