shell mysql awk_linux脚本Shell之awk详解

一.基本介绍

1.awk:

awk是一个强大的文本分析工具,在对文本文件的处理以及生成报表,awk是无可替代的。awk认为文本文件都是结构化的,它将每一个输入行定义为一个记录,行中的每个字符串定义为一个域(段),域和域之间使用分割符分割。

2.功能:流控制、数学运算、进程控制、内置的变量和函数、循环和判断

3.工作原理:

awk 会把每行进行一个拆分,用相应的命令对拆分出来的“段”进行处理。

(1)行工作模式,读入文件的每一行,会把一行的内容,存到$0里

(2)使用内置的变量FS(段的分隔符,默认用的是空白字符),分割这一行,把分割出来的每个段存到相应的变量$(1-100)

(3)输出的时候按照内置变量OFS(out FS),输出

(4)读入下一行继续操作

简单实例

1 [root@tx3 ~]#echo "this is a book" > awk.txt

2 [root@tx3 ~]#awk '{print $2,$1,$3,$4}' awk.txt

is this a book

4. Awk常用内置变量表:

1 $0 当前记录(作为单个变量)

2 $1~$n 当前记录的第n个字段,字段间由FS分隔

3 FS 输入字段分隔符 默认是空格 (可记忆为:FieldsSpace缩写)

4 NF 当前记录中的字段个数,就是有多少列 (可记忆为:NumberFields缩写)

5 NR 已经读出的记录数,就是行号,从1开始 (可记忆为:NumberRows缩写)

6 RS 输入的记录他隔符默 认为换行符 (可记忆为:RowsSpace缩写)

7 OFS 输出字段分隔符 默认也是空格 (可记忆为:OutputFieldsSpace缩写)

8 ORS 输出的记录分隔符,默认为换行符 (可记忆为:OutputRowsSpace缩写)

9 ARGC 命令行参数个数

10 ARGV 命令行参数数组

11 FILENAME 当前输入文件的名字

12 IGNORECASE 如果为真,则进行忽略大小写的匹配

13 ARGIND 当前被处理文件的ARGV标志符

14 CONVFMT 数字转换格式 %.6g

15 ENVIRON UNIX环境变量

16 ERRNO UNIX系统错误消息

17 FIELDWIDTHS 输入字段宽度的空白分隔字符串

18 FNR 当前记录数

19 OFMT 数字的输出格式 %.6g

20 RSTART 被匹配函数匹配的字符串首

21 RLENGTH 被匹配函数匹配的字符串长度

二.print的简单使用

例:打印整行: $0

1 [root@tx3 ~]#cp /etc/passwd p1

2 [root@tx3 ~]#awk '{print $0}' p1

例:打印每行的最后一个字段: $NF

1 [root@tx3 ~]#awk -F : '{print $NF}' p1

例:打印第三个字段: $3

[root@tx3 ~]#awk -F : '{print $3}' p1

例:打印第一行NR==1

1 [root@tx3 ~]#awk 'NR==1{print $0}' p1

root:x:0:0:root:/root:/bin/bash

例:打印最后一行

1 [root@tx3 ~]#awk 'END{print $0}' p1

tx:x:500:500:tx:/home/tx:/bin/bash

例:打印第一行最后一个字段

1 [root@tx3 ~]#awk -F: 'NR==1{print $NF}' p1

/bin/bash

例:打印最后一行最后一个字段

1 [root@tx3 ~]#awk -F: 'END{print $NF}' p1

例:打印每行的倒数第二个字段,并在其后打印你好

1 [root@tx3 ~]#awk -F: '{print $(NF-1),"nihao"}' p1

/root nihao/bin nihao/sbin nihao

例:打印行号

1 [root@tx3 ~]#awk '{print NR,$0}' p1

1 root:x:0:0:root:/root:/bin/bash2 bin:x:1:1:bin:/bin:/sbin/nologin3 daemon:x:2:2:daemon:/sbin:/sbin/nologin

例:打印当前系统环境变量的某个特定值

1 [root@tx3 ~]#awk 'BEGIN{print ENVIRON["PATH"];}'

/usr/kerberos/sbin:/usr/kerberos/bin:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin

例: 用:分割,删除第2个字段

1 [root@tx3 ~]#awk 'BEGIN{FS=":";OFS=":"}{print $1,$3,$4,$5,$6,$7}' p1

root:0:0:root:/root:/bin/bashbin:1:1:bin:/bin:/sbin/nologindaemon:2:2:daemon:/sbin:/sbin/nologin

BEGIN和END:(打印报表实例)

在Unix awk中两个特别的表达式,BEGIN和END,这两者都可用于pattern中(参考前面的awk语法),提供BEGIN和END的作用是给程序赋予初始状态和在程序结束之后执行一些扫尾的工作。

任何在BEGIN之后列出的操作(在{}内)将在Unix awk开始扫描输入之前执行,而END之后列出的操作将在扫描完全部的输入之后执行。因此,通常使用BEGIN来显示变量和预置(初始化)变量,使用END来输出最终结果。

例:累计销售文件xs中的销售金额(假设销售金额在记录的第三字段):

1 [root@tx3 ~]#awk 'BEGIN{FS=":";print "统计销售金额";total=0}{print $3;total=total+$3;}END{printf "销售金额总计:%.2f",total}' sx

在这里,BEGIN预置了内部变量FS(字段分隔符)和自定义变量total,同时在扫描之前显示出输出行头。而END则在扫描完成后打印出总合计。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值