gawk
- gawk通常用来从大文本文件中提取数据元素并将它们格式化成可度的报告
- Crtl+D组合键能终止gawk程序并返回到命令行界面提示符下
- gawk读取文本文件并显示第1数据字段值
gawk -F: '{print $1}' /etc/passwd
- gawk允许将程序存储到文件中
$ cat script1
{print $1}
$ gawk -F: -f script1 /etc/passwd
- gawk在读取数据前执行BEGIN关键字后指定的程序脚本
gawk -F: 'BEGIN { print "Hello World"} {print $1}' /etc/passwd
- gawk在读取数据之后执行END关键字后指定的程序脚本
gawk -F: '{print $1} END {print "end file"}' /etc/passwd
$ cat data
data11 data12 data13 data14 data15
data21 data22 data23 data24 data25
data31 data32 data33 data34 data35
$ gawk 'BEGIN{FS=" "; OFS="-"}{print $1,$2,$3}' data
data11-data12-data13
data21-data22-data23
data31-data32-data33
- 一旦设置了FIELDWIDTH变量,gawk就会忽略FS变量,而根据提供的字段宽度大小来计算字段
- RS用来指定行分隔符
- NF变量允许你指定数据行中的最后一个数据字段,而不用知道它的具体位置
gawk 'BEGIN{FS=":"; OFS=":"}{print $1,$NF}' /etc/passwd
- 匹配操作符允许你将正则表达式限定在数据行中的特定数据段
$ cat data1
data11,data12,data13,data14,data15
data21,data22,data23,data24,data25
data31,data32,data33,data34,data35
$ gawk 'BEGIN{FS=","} $2 ~ /^data2/{print $0}' data1