awk使用总结

1. awk命令格式

      awk [options] 'scripts' file

      命令选项为:

              -F fs or --field-separator fs, 指定分隔符

             -v var=value or --asign var=value, 给awk指定变量

      awk脚本由模式和操作组成:pattern {action}。两者是可选的。

      模式可以是以下任意一个:

  • /正则表达式/:使用通配符的扩展集。

  • 关系表达式:可以用下面运算符表中的关系运算符进行操作,可以是字符串或数字的比较,如$2>%1选择第二个字段比第一个字段长的行。

  • 模式匹配表达式:用运算符~(匹配)和~!(不匹配)。

  • 模式,模式:指定一个行的范围。该语法不能包括BEGIN和END模式。

  • BEGIN:让用户指定在第一条输入记录被处理之前所发生的动作,通常可在这里设置全局变量。

  • END:让用户在最后一条输入记录被读取之后发生的动作

      操作:由一个或多个命令、函数、表达式组成,之间由换行符或分号隔开,并位于大括号内。

2. awk环境变量

    $n:当前记录的第n个字段

    $0:当前整个记录

    FS:字段分隔符,默认为空格

    RS:记录分隔符,默认为换行符

    NF:当前记录的字段数

    NR:当前记录数

    FNR:同NR,但相对于当前文件

3. 几个实例

3.1 awk给shell变量赋值

      将一个记录的第一、第二个字段分别赋值给x、y、z:

       eval $(awk '{ printf("x=%s\ny=%s\nz=%s",$1,$2,$3); }' ./file),注意\n是必须的。

     将一个记录的第一个字段赋值给x:

      x=`awk 'print $1' ./file`,注意``是Tab键上面的键,且=左右不能有空格。

3.2 打印当前行的上一行和下一行

  假设文件内容为:            

          1234

           AAAAA

          23456

3.2.1 打印某一行的下一行:

       awk '{a[NR]=$0; if(a[NR-1] ~/A+/) {print a[NR] } }' file

  23456

3.2.2 打印某一行的上一行:

       awk '{a[NR]=$0; if(a[NR]~/A+/) {print a[NR-1] } }'  file

3.3 shell给awk传递参数

      匹配-v 参数指定的字符的一行:

     awk -v var=$application '{if($1 ~ /var/) {print $2}}' input_file >> output_file

3.4 统计某一个字符串(以frequency为例)出现的频率:

awk 'BEGIN {count=0;}{if($1~/frequency/) count++;} END {print count}' input_file >> output_file


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值