awk内置变量(预定义变量)
说明:[A][N][P][G]表示第一个支持变量的工具,[A]=awk、[N]=nawk、[P]=POSIXawk、[G]=gawk
- $n 当前记录的第n个字段,比如n为1表示第一个字段,n为2表示第二个字段。
- $0 这个变量包含执行过程中当前行的文本内容。
- [A] FS :字段分隔符(默认是任何空格)。
- [A] NF :表示字段数,在执行过程中对应于当前的字段数。
- [A] NR :表示记录数,在执行过程中对应于当前的行号。
- [A] FILENAME : 当前输入文件的名。
- [A] OFMT :数字的输出格式(默认值是%.6g)。
- [A] OFS :输出字段分隔符(默认值是一个空格)。
- [A] ORS :输出记录分隔符(默认值是一个换行符)。
- [A] RS :记录分隔符(默认是一个换行符)。
- [N] ARGC :命令行参数的数目。
- [N] ARGV :包含命令行参数的数组。
- [N] ERRNO :最后一个系统错误的描述。
- [N] RSTART :由match函数所匹配的字符串的第一个位置。
- [N] RLENGTH :由match函数所匹配的字符串的长度。
- [N] SUBSEP 数组下标分隔符(默认值是34)。
- [P] ENVIRON :环境变量关联数组。
- [P] FNR :同NR,但相对于当前文件。
- [G] ARGIND :命令行中当前文件的位置(从0开始算)。
- [G] CONVFMT :数字转换格式(默认值为%.6g)。
- [G] FIELDWIDTHS :字段宽度列表(用空格键分隔)。
- [G] IGNORECASE :如果为真,则进行忽略大小写的匹配。
示例
NR纪录数
NF字段数
FILENAME文件名
ARGC命令行参数数量
[root@sxooky ~]# echo -e "line1 f2 f3\nline2 f4 f5\nline3 f6 f7" > a.txt
[root@sxooky ~]# echo -e "test1 f2 f3 a1\ntest2 f4 f5 a2\ntest3 f6 f7 a3 a4" > b.txt
[root@sxooky ~]# awk '{print "NR:"NR,"NF:"NF,"FILENAME:"FILENAME,"ARGC:"ARGC}' a.txt b.txt
NR:1 NF:3 FILENAME:a.txt ARGC:3
NR:2 NF:3 FILENAME:a.txt ARGC:3
NR:3 NF:3 FILENAME:a.txt ARGC:3
NR:4 NF:4 FILENAME:b.txt ARGC:3
NR:5 NF:4 FILENAME:b.txt ARGC:3
NR:6 NF:5 FILENAME:b.txt ARGC:3
NR变量的应用(纪录数)
统计文件中的行数:
[root@sxooky ~]# cat a.txt
line1 f2 f3
line2 f4 f5
line3 f6 f7
[root@sxooky ~]# awk 'END{print "NR_total:"NR}' a.txt
NR_total:3
以上命令只使用了END语句块,在读入每一行的时,awk会将NR更新为对应的行号,当到达最后一行NR的值就是最后一行的行号,所以END语句块中的NR就是文件的行数。
每行中第一个字段的累加:
[root@sxooky ~]# seq 5 | awk 'BEGIN{ sum=0; print "求各字段累加总和:" } { print $1"+"; sum+=$1 } END{ print "等于"; print sum }'
求各字段累加总和:
1+
2+
3+
4+
5+
等于
15
ORS变量的应用
ORS输出记录分隔符,缺省则为换行(“\n”) 如上例
上例中将其内容连接到一行:
[root@sxooky ~]# seq 5 | awk 'BEGIN{ sum=0; print "求各字段累加总和:";ORS="" }NR==1{print $1;sum+=$1}NR>=2{print "+"$1;sum+=$1}END{ print "="; print sum "\n"}'
求各字段累加总和:
1+2+3+4+5=15
OFS变量的应用
OFS输出字段分隔符,默认为空(没有)。
[root@sxooky ~]# cat a.txt
line1 f2 f3
line2 f4 f5
line3 f6 f7
[root@sxooky ~]# awk 'BEGIN{OFS=" - "}{print $1,$2,$3}' a.txt
line1 - f2 - f3
line2 - f4 - f5
line3 - f6 - f7
[root@sxooky ~]# awk 'BEGIN{OFS="......"}{print $1,$2,$3}' a.txt
line1......f2......f3
line2......f4......f5
line3......f6......f7
RS变量控制记录分隔符
[root@sxooky ~]# awk 'BEGIN{ORS=" - "}{print}END{ORS="\n";print "\n"}' a.txt
line1 f2 f3 - line2 f4 f5 - line3 f6 f7 -
[root@sxooky ~]# awk 'BEGIN{ORS=" - "}{print}END{ORS="\n";print "\n"}' a.txt |awk 'BEGIN{RS=" - "}{print $1}'
line1
line2
line3
[root@sxooky ~]# tail -1 /etc/passwd
sxooky:x:3367:3367::/home/sxooky:/bin/bash
[root@sxooky ~]# tail -1 /etc/passwd |awk 'BEGIN{RS=":"}{print $1}'
sxooky
x
3367
3367
/home/sxooky
/bin/bash
[root@sxooky ~]# tail -1 /etc/passwd |awk 'BEGIN{RS="/"}{print $1}'
sxooky:x:3367:3367::
home
sxooky:
bin
bash
NF变量的应用(打印某个字段)
[root@sxooky ~]# cd /usr/local/apache2.4/htdocs/wordpress/
[root@sxooky wordpress]# pwd
/usr/local/apache2.4/htdocs/wordpress
[root@sxooky wordpress]# pwd |awk -F"/" '{print $0}'
/usr/local/apache2.4/htdocs/wordpress
#打印最后一个字段或倒数第二个字段
[root@sxooky wordpress]# pwd |awk -F"/" '{print $NF}'
wordpress
[root@sxooky wordpress]# pwd |awk -F"/" '{print $(NF-1)}'
htdocs
awk外部变量
一般变量
在awk中,设置有意义的域名是一种好习惯一般的变量名设置方式为 var = $n,这里var 为调用的域变量名, n为实际域号。
- 找出uid>1000的用户
[root@sxooky ~]# tail -1 /etc/passwd
sxooky:x:3367:3367::/home/sxooky:/bin/bash
[root@sxooky ~]# awk -F: '{name=$1;id=$3;if(id>1000)print name "\t" id}' /etc/passwd
mysql 3366
sxooky 3367
统计当前文件下面所有文件的大小之和:
- 统计除目录外的文件大小总和
[root@sxooky ~]# ls -al |awk 'BEGIN{total=0}{if(/^[^d]/){total+=$5;print $5"\t"$9}}END{print "total size:" total}'
36 a.txt
18 awk_var.txt
14522 .bash_history
18 .bash_logout
176 .bash_profile
176 .bashrc
48 b.txt
100 .cshrc
74454 logssh.txt
893 .mysql_history
64 .pydistutils.cfg
129 .tcshrc
8979 .viminfo
total size:99613
将外部变量值传递给awk
- 借助-v选项,可以将外部值(并非来自stdin)传递给awk:
- 另一种传递外部变量方法
- 当输入来自于文件时使用
[root@sxooky ~]# VAR=12345
[root@sxooky ~]# echo |awk -v var=$VAR '{print var}'
12345
[root@sxooky ~]# var1="abc"
[root@sxooky ~]# var2="123"
[root@sxooky ~]# echo |awk '{print v1 "\t" v2}' v1=$var1 v2=$var2
abc 123
[root@sxooky ~]# vim awk_var.txt
以上方法中,变量之间用空格分隔作为awk的命令行参数跟随在BEGIN、{}和END语句块之后。