一.AWK的部分内置变量(自定义变量的方法类似Shell)
$0当前记录(作为单个变量) | $1~$NF当前记录的第n个字段,字段间由FS分隔 |
NF当前记录中的字段个数 | NR已读出的记录数,就是行号,从1开始 |
FS输入字段分隔符,默认是空格 | RS输入的记录分隔符,默认为换行符 |
OFS输出字段分隔符,默认也是空格 | ORS输出的记录分隔符,默认为换行符 |
FILENAME当前输入文件的名字 | FNR当前文件的当前记录号,读入新的记录时FNR增加。 |
ARGC 命令行参数的个数 | SUBSEP 下标分隔符,缺省为"\034" |
ARGV 命令行参数数组 | RSTART 由match() 匹配的第一个字符的索引 |
ENVIRON 环境变量数组 | OFMT 数的输出格式,缺省为"%.6g" |
ARGCIND 当前命令行参数下标 | RLENGTH 由match() 匹配的串的长度 |
IGNORECASE 忽略正则表达式和串的大小写 |
|
二.内置变量应用举例(在BEGIN定义对整个文件生效)
1.常用操作(/^root/ 为选择表达式,$0代表当前行记录) $ awk '/^root/{print NR " line ",$0}' /etc/passwd 1 line root:x:0:0:root:/root:/bin/bash |
2.设置字段分隔符号(FS使用方法, NF是字段总数, NR得到当前记录所在行) # awk 'BEGIN{FS=":"}/^root/{print NR,$1,$NF}' /etc/passwd|head -n 1 1 root /bin/bash |
3.设置输出字段分隔符(OFS设置默认字段分隔符) # awk 'BEGIN{FS=":";OFS="^^"}/^root/{print FNR,$1,$NF}' /etc/passwd 1^^root^^/bin/bash $ awk 'BEGIN {ORS=""} // { print } END {print "\n"}' example |
4.设置输出行记录分隔符(ORS使用方法) # awk 'BEGIN{FS=":";ORS="^^"}{print FNR,$1,$NF}' /etc/passwd 1 root /bin/bash^^2 bin /sbin/nologin^^3 daemon /sbin/nologin^^...... |
5.获得传入的文件名(FILENAME使用, BEGIN中不能获得任何与文件记录操作的变量) # awk 'BEGIN{FS=":" }{print FILENAME}' /etc/passwd /etc/passwd # awk -F: 'END{print FILENAME}NF > 2' list.txt 当前记录中字段的个数>2 # awk -F: NF > 2; 'END{print FILENAME}' list.txt |
6.获得linux环境变量(ENVIRON使用) # awk 'BEGIN{print ENVIRON["PATH"];}' /etc/passwd /usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin ENVIRON是子典型数组,可以通过对应键值获得它的值。 |
7.输出数据格式设置:(OFMT默认输出格式是:%.6g 保留六位小数) # awk 'BEGIN{OFMT="%.3f";print 2/3,123.11111111;}' /etc/passwd 0.667 123.111 。 |
8.按宽度指定分隔符(FIELDWIDTHS="4 2 2"就表示$1宽度是4,$2是2,$3是2) # echo 20100117054932 | awk 'BEGIN{FIELDWIDTHS="4 2 2 2 2 3"}{print $1"-"$2"-"$3,$4":"$5":"$6}' 2010-01-17 05:49:32 |
9.RSTART 被匹配正则表达式首位置,RLENGTH 匹配字符长度,没有找到为-1 # awk 'BEGIN{start=match("this is a test",/[a-z]+$/); print start, RSTART, RLENGTH }' 11 11 4 # awk 'BEGIN{start=match("this is a test",/^[a-z]+$/); print start, RSTART, RLENGTH }' 0 0 –1 |