AWK程序:
调用方式:
1、命令行方式:awk [-F field-separator] 'commands' input-file(s)
2、将所有awk命令插入一个文件,并使其可执行,然后用awk命令解释器作为脚本首行,便于输入脚本名称来调用。#!/bin/awk -f
3、将所有awk命令插入一个单独的文件,然后调用:awk -f awk-script-file input-file(s)
任何的awk语句都是由模块和动作组成,模块包括两个特殊的字段BEGIN和END,BEGIN用于设置计数和打印头,END用来在awk完成文本浏览动作之后打印输出文本总数和结尾状态标志。实际的动作在{}内部指明,如不指定,awk将打印出所有浏览出来的记录。
awk执行时,其浏览域标记为$1,$2...$n
。所有域用$0
表示。
awk中的正则表达式及操作,元字符 \ ^ $ . [] | () + ? * 等。条件操作符有 < <= == != > >= ~ !~;~为匹配正则表达式。逻辑运算: && and || or ! 等。
内置变量:
ARGC 命令行参数个数
ARGV 命令行参数排列
ENVIRON 支持队列中系统环境变量的使用
FILENAME awk浏览的文件名
FNR 浏览文件的记录数
FS 设置输入域分隔符,等价于命令行 -F选项
NF 浏览记录的域的个数
NR 已读的记录数
OFS 输出域分隔符
ORS 输出记录分隔符
RS 控制记录分隔符
这里的NF的一个常用的功能是将变量$PWD 返回值传入awk并显示其目录,当然这里需要指定分隔符为’/’。echo $PWD | awk -F '/' '{print $NF}'
awk命令出错排查
1、确保命令内部的引号都是成对出现
2、保证整个命令是用”单引号括起来的
3、注意{}括起动作语句,()括起条件语句
awk '{if($4~/aa/) print $0}' test.file
<===> awk '$0 ~ /aa/' test.file
awk内置字符串函数
gsub(r,s) 在整个
0中用s替代rgsub(r,s,t)在整个t中用s替代rindex(s,t)返回s中字符串t的第一位置length(s)返回s长度match(s,r)测试s是否包含匹配r的字符串split(s,a,fs)在fs上将s分成序列asprint(fmt,exp)返回经fmt格式化后的expsub(r,s)用
0中最左边最长的子串代替s
substr(s,p) 返回字符串s中从p开始的后缀部分
substr(s,p,n) 返回字符串s中从p开始长度为n的后缀部分
向一行awk命令传值:awk '{if($5 < AGE) print $0}' AGE=10 test.file
向awk脚本传值:awk script_file var=value input_file
写awk脚本:首行:#!/bin/awk -f
#!/bin/awk -f
BEGIN{
str="123,456,789";
split(str,myarray,",")}
END{
for (i in myarray) {print myarray[i]}
}