shell-8.awk

yan_baby_liu

已于 2022-12-27 10:52:27 修改

阅读量826

点赞数

分类专栏： Shell 文章标签： unix 正则表达式 linux

于 2022-10-28 17:25:15 首次发布

本文链接：https://blog.csdn.net/qq_24223159/article/details/127557532

版权

Shell 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

文章目录

一、awk介绍
- 1. awk概述
- 2. awk能干啥?
二、awk使用方式
三、 awk内部相关变量
- - 1、==常用内置变量举例==
  - 2、内置变量分隔符举例
四、 awk工作原理
五、awk使用进阶
六、awk的脚本编程
七、awk的算法运算
八、awk统计案例

一、awk介绍

1. awk概述

awk是一种编程语言，主要用于在linux/unix下对文本和数据进行处理，是linux/unix下的一个工具。数据可以来自标准输入、一个或多个文件，或其它命令的输出。
awk的处理文本和数据的方式：逐行扫描文件，默认从第一行到最后一行，寻找匹配的特定模式的行，并在这些行上进行你想要的操作。
awk分别代表其作者姓氏的第一个字母。因为它的作者是三个人，分别是Alfred Aho、Brian Kernighan、Peter Weinberger。
gawk是awk的GNU版本，它提供了Bell实验室和GNU的一些扩展。
下面介绍的awk是以GNU的gawk为例的，在linux系统中已把awk链接到gawk，所以下面全部以awk进行介绍。

2. awk能干啥?

awk用来处理文件和数据的，是类unix下的一个工具，也是一种编程语言
可以用来统计数据，比如网站的访问量，访问的IP量等等
支持条件判断，支持for和while循环

查看本机命令所在位置

[root@node2 shell105]# which sed
/usr/bin/sed
[root@node2 shell105]# which java
/usr/bin/java
[root@node2 shell105]# which awk
/usr/bin/awk
[root@node2 shell105]# 

[root@node2 shell105]# ll /bin/awk 
lrwxrwxrwx. 1 root root 4 6月  21 17:55 /bin/awk -> gawk
[root@node2 shell105]#

二、awk使用方式

1. 命令行模式使用

㈠语法结构

awk 选项 '命令部分' 文件名


特别说明：
引用shell变量需用双引号引起

例如之前从幸运名单中，找到某个号码，删除,也用到了变量，单引号也需要改成双引号

luck_line=1230093
sed -i "/$luck_line/d" file文件名

㈡常用选项介绍

-F 定义字段分割符号，默认的分隔符是空格
-v 定义变量并赋值

㈢ '命名部分说明’

正则表达式，地址定位

'/root/{awk语句}'				sed中： '/root/p'
'NR==1,NR==5{awk语句}'			sed中： '1,5p'
'/^root/,/^ftp/{awk语句}'  	sed中：'/^root/,/^ftp/p'

{awk语句1**;awk语句2;**…}

'{print $0;print $1}'		sed中：'p'
'NR==5{print $0}'				sed中：'5p'
注：awk命令语句间用分号间隔

‘BEGIN{awk语句};{处理中};END{awk语句}’

'BEGIN{awk语句};{处理中};END{awk语句}'
'BEGIN{awk语句};{处理中}'
'{处理中};END{awk语句}'

2. 脚本模式使用

㈠脚本编写

#!/bin/awk -f 		定义魔法字符
以下是awk引号里的命令清单，不要用引号保护命令，多个命令用分号间隔
BEGIN{FS=":"}
NR==1,NR==3{print $1"\t"$NF}
...

㈡脚本执行

方法1：
awk 选项 -f awk的脚本文件  要处理的文本文件
awk -f awk.sh filename

sed -f sed.sh -i filename

方法2：
./awk的脚本文件(或者绝对路径)	要处理的文本文件
./awk.sh filename

./sed.sh filename

三、 awk内部相关变量

变量	变量说明	备注
$0	当前处理行的所有记录
$1,$2,$3…$n	文件中每行以间隔符号分割的不同字段	awk -F: ‘{print $1,$3}’
NF	当前记录的字段数（列数）	awk -F: ‘{print NF}’
$NF	最后一列	$(NF-1)表示倒数第二列
FNR/NR	行号
FS	定义间隔符	‘BEGIN{FS=“:”};{print $1,$3}’
OFS	定义输出字段分隔符，默认空格	‘BEGIN{OFS=“\t”};print $1,$3}’
RS	输入记录分割符，默认换行	‘BEGIN{RS=“\t”};{print $0}’
ORS	输出记录分割符，默认换行	‘BEGIN{ORS=“\n\n”};{print $1,$3}’
FILENAME	当前输入的文件名

[root@node2 shell106]# head /etc/passwd > 1.txt
[root@node2 shell106]# cat 1.txt 
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin
[root@node2 shell106]# 


依次将每一行给到$0，并打印出来
[root@node2 shell106]# awk '{print $0}' 1.txt 
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin
[root@node2 shell106]#

打印1,到5行，先定位，再打印

[root@node2 shell106]# awk 'NR==1,NR==5{print $0}' 1.txt 
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
[root@node2 shell106]#

打印第一行或者第五行

[root@node2 shell106]# awk  'NR==1 || NR==5{print $0}' 1.txt 
root:x:0:0:root:/root:/bin/bash
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
[root@node2 shell106]#

打印第三行到第五行

[root@node2 shell106]# awk  'NR==1,NR==5{print $0}' 1.txt 
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
[root@node2 shell106]# 



[root@node2 shell106]# awk 'NR==1,NR==5' 1.txt   没有动作，默认也是print $0
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
[root@node2 shell106]#

打印能匹配到root的行信息

[root@node2 shell106]# awk '/root/{print $0}' 1.txt 
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
[root@node2 shell106]# 


[root@node2 shell106]# awk '/root/' 1.txt 
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
[root@node2 shell106]#

[root@node2 shell106]# awk -F: '/root/{print $1,$NF,$(NF-1),NF}' 1.txt 
root /bin/bash /root 7
operator /sbin/nologin /root 7
[root@node2 shell106]#

awk是一门语言，它支持逻辑运算符，如下采用逻辑运算符

[root@node2 shell106]# awk 'NR>=3 && NR<=5{print $0}' 1.txt 
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
[root@node2 shell106]#

用：分隔，打印第一列和最后一列

[root@node2 shell106]# awk -F: '{print $1,$NF}' 1.txt 
root /bin/bash
bin /sbin/nologin
daemon /sbin/nologin
adm /sbin/nologin
lp /sbin/nologin
sync /bin/sync
shutdown /sbin/shutdown
halt /sbin/halt
mail /sbin/nologin
operator /sbin/nologin
[root@node2 shell106]#

再多打印倒数第二列

[root@node2 shell106]# awk -F: '{print $1,$NF,$(NF-1)}' 1.txt 
root /bin/bash /root
bin /sbin/nologin /bin
daemon /sbin/nologin /sbin
adm /sbin/nologin /var/adm
lp /sbin/nologin /var/spool/lpd
sync /bin/sync /sbin
shutdown /sbin/shutdown /sbin
halt /sbin/halt /sbin
mail /sbin/nologin /var/spool/mail
operator /sbin/nologin /root
[root@node2 shell106]#

打印用：分隔以后，列数是多少

[root@node2 shell106]# awk -F: '{print NF}' 1.txt
7
7
7
7
7
7
7
7
7
7

[root@node2 shell106]# cat -n 1.txt 
     1  root:x:0:0:root:/root:/bin/bash
     2  bin:x:1:1:bin:/bin:/sbin/nologin
     3  daemon:x:2:2:daemon:/sbin:/sbin/nologin
     4  adm:x:3:4:adm:/var/adm:/sbin/nologin
     5  lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
     6  sync:x:5:0:sync:/sbin:/bin/sync
     7  shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
     8  halt:x:7:0:halt:/sbin:/sbin/halt
     9  mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
    10  operator:x:11:0:operator:/root:/sbin/nologin
[root@node2 shell106]# 
为什么第一行会打印两次呢，因为第一行，符合在1到5行内，所以输出一次
然后又符合属于以root开头，再输出一次
[root@node2 shell106]# awk 'NR==1,NR==5;/^root/{print $0}' 1.txt 
root:x:0:0:root:/root:/bin/bash
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

1、常用内置变量举例

# awk -F: '{print $1,$(NF-1)}' 1.txt
# awk -F: '{print $1,$(NF-1),$NF,NF}' 1.txt
# awk '/root/{print $0}' 1.txt
# awk '/root/' 1.txt
# awk -F: '/root/{print $1,$NF}' 1.txt 
root /bin/bash
# awk -F: '/root/{print $0}' 1.txt      
root:x:0:0:root:/root:/bin/bash
# awk 'NR==1,NR==5' 1.txt 
# awk 'NR==1,NR==5{print $0}' 1.txt
# awk 'NR==1,NR==5;/^root/{print $0}' 1.txt 
root:x:0:0:root:/root:/bin/bash
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

2、内置变量分隔符举例

FS和OFS:
# awk 'BEGIN{FS=":"};/^root/,/^lp/{print $1,$NF}' 1.txt
# awk -F: 'BEGIN{OFS="\t\t"};/^root/,/^lp/{print $1,$NF}' 1.txt        
root            /bin/bash
bin             /sbin/nologin
daemon          /sbin/nologin
adm             /sbin/nologin
lp              /sbin/nologin
# awk -F: 'BEGIN{OFS="@@@"};/^root/,/^lp/{print $1,$NF}' 1.txt     
root@@@/bin/bash
bin@@@/sbin/nologin
daemon@@@/sbin/nologin
adm@@@/sbin/nologin
lp@@@/sbin/nologin
[root@server shell07]# 

RS和ORS：
修改源文件前2行增加制表符和内容：
vim 1.txt
root:x:0:0:root:/root:/bin/bash hello   world
bin:x:1:1:bin:/bin:/sbin/nologin        test1   test2

# awk 'BEGIN{RS="\t"};{print $0}' 1.txt
# awk 'BEGIN{ORS="\t"};{print $0}' 1.txt

默认用空格分隔，我们看到第一列和最后一列是用空格分隔的

[root@node2 shell106]# awk -F: '{print $1,$NF}' 1.txt 
root /bin/bash
bin /sbin/nologin
daemon /sbin/nologin
adm /sbin/nologin
lp /sbin/nologin
sync /bin/sync
shutdown /sbin/shutdown
halt /sbin/halt
mail /sbin/nologin
operator /sbin/nologin

{print $1,$ NF}是处理中，如果我们要指定输出的分隔符，就要在处理中前面设置

[root@node2 shell106]# awk -F: 'BEGIN{OFS="@"};{print $1,$NF}' 1.txt 
root@/bin/bash
bin@/sbin/nologin
daemon@/sbin/nologin
adm@/sbin/nologin
lp@/sbin/nologin
sync@/bin/sync
shutdown@/sbin/shutdown
halt@/sbin/halt
mail@/sbin/nologin
operator@/sbin/nologin
[root@node2 shell106]#

-F: 换成BEGIN{FS=“:”}

[root@node2 shell106]# awk 'BEGIN{FS=":";OFS="@@@@"};{print $1,$NF}' 1.txt
root@@@@/bin/bash
bin@@@@/sbin/nologin
daemon@@@@/sbin/nologin
adm@@@@/sbin/nologin
lp@@@@/sbin/nologin
sync@@@@/bin/sync
shutdown@@@@/sbin/shutdown
halt@@@@/sbin/halt
mail@@@@/sbin/nologin
operator@@@@/sbin/nologin
[root@node2 shell106]# 

或者

[root@node2 shell106]# awk 'BEGIN{FS=":"};{print $1"@@@@@@@"$NF}' 1.txt
root@@@@@@@/bin/bash
bin@@@@@@@/sbin/nologin
daemon@@@@@@@/sbin/nologin
adm@@@@@@@/sbin/nologin
lp@@@@@@@/sbin/nologin
sync@@@@@@@/bin/sync
shutdown@@@@@@@/sbin/shutdown
halt@@@@@@@/sbin/halt
mail@@@@@@@/sbin/nologin
operator@@@@@@@/sbin/nologin
[root@node2 shell106]# 



[root@node2 shell106]# awk 'BEGIN{FS=":"};{print "用户名是:"$1"shell解析器是:"$NF}' 1.txt
用户名是:rootshell解析器是:/bin/bash
用户名是:binshell解析器是:/sbin/nologin
用户名是:daemonshell解析器是:/sbin/nologin
用户名是:admshell解析器是:/sbin/nologin
用户名是:lpshell解析器是:/sbin/nologin
用户名是:syncshell解析器是:/bin/sync
用户名是:shutdownshell解析器是:/sbin/shutdown
用户名是:haltshell解析器是:/sbin/halt
用户名是:mailshell解析器是:/sbin/nologin
用户名是:operatorshell解析器是:/sbin/nologin

awk如何区分一行，是默认按照换行符，遇到换行符，就认为接下来是下一行了

那区分行的符号，是否可以指定呢？–用RS来定义

修改1.txt 第一行新增hello world，中间有制表符
第二行新增 lucy，中间是制表符
在这里插入图片描述

[root@node2 shell106]# awk -F: 'BEGIN{RS="\t"};{print $1}' 1.txt
root
hello
world
bin
lucy
daemon

\t是制表符，因为我们制表符有三个，所以被看成了4行

四、 awk工作原理

awk -F: '{print $1,$3}' /etc/passwd

awk使用一行作为输入，并将这一行赋给内部变量$0，每一行也可称为一个记录，以换行符(RS)结束
每行被间隔符**:**(默认为空格或制表符)分解成字段(或域)，每个字段存储在已编号的变量中，从$1开始

问：awk如何知道用空格来分隔字段的呢？

答：因为有一个内部变量FS来确定字段分隔符。初始时，FS赋为空格
awk使用print函数打印字段，打印出来的字段会以空格分隔，因为$1,$3之间有一个逗号。逗号比较特殊，它映射为另一个内部变量，称为输出字段分隔符OFS，OFS默认为空格
awk处理完一行后，将从文件中获取另一行，并将其存储在$0中，覆盖原来的内容，然后将新的字符串分隔成字段并进行处理。该过程将持续到所有行处理完毕

五、awk使用进阶

1. 格式化输出`print`和`printf`

print函数		类似echo "hello world"
# date |awk '{print "Month: "$2 "\nYear: "$NF}'
# awk -F: '{print "username is: " $1 "\t uid is: "$3}' /etc/passwd


printf函数		类似echo -n
# awk -F: '{printf "%-15s %-10s %-15s\n", $1,$2,$3}'  /etc/passwd
# awk -F: '{printf "|%15s| %10s| %15s|\n", $1,$2,$3}' /etc/passwd
# awk -F: '{printf "|%-15s| %-10s| %-15s|\n", $1,$2,$3}' /etc/passwd

awk 'BEGIN{FS=":"};{printf "%-15s %-15s %-15s\n",$1,$6,$NF}' a.txt

%s 字符类型  strings			%-20s
%d 数值类型	
占15字符
- 表示左对齐，默认是右对齐
printf默认不会在行尾自动换行，加\n

[root@node2 shell106]# echo 1 ;echo 2
1
2
[root@node2 shell106]# echo -n 1;echo  2
12

[root@node2 shell106]# date 
2022年 10月 27日 星期四 18:19:03 CST
[root@node2 shell106]# date | awk '{print $1}'
2022年
[root@node2 shell106]# date | awk '{print "Month:"$2"\nYear:"$1}'
Month:10月
Year:2022年

[root@node2 shell106]# awk -F: '{print "username is :"$1"\t uid is :"$3}' /etc/passwd
username is :root        uid is :0
username is :bin         uid is :1
username is :daemon      uid is :2
username is :adm         uid is :3

不加- ，默认就是右对齐

[root@node2 shell106]# awk -F: '{printf "%15s %10s %15s\n",$1,$2,$3}' /etc/passwd
           root          x               0
            bin          x               1
         daemon          x               2
            adm          x               3
             lp          x               4
           sync          x               5
       shutdown          x               6
           halt          x               7

设置制表符的长度 %-15s 表示字符串15长度，左对齐

[root@node2 shell106]# awk -F: '{printf "%-15s %-10s %-15s\n",$1,$2,$3}' /etc/passwd
root            x          0              
bin             x          1              
daemon          x          2              
adm             x          3              
lp              x          4              
sync            x          5              
shutdown        x          6              
halt            x          7              
mail            x          8  




[root@node2 shell106]# awk -F: '{printf "|%15s| %10s| %15s|\n", $1,$2,$3}' /etc/passwd
|           root|          x|               0|
|            bin|          x|               1|
|         daemon|          x|               2|
|            adm|          x|               3|
|             lp|          x|               4|
|           sync|          x|               5|
|       shutdown|          x|               6|
|           halt|          x|               7|
|           mail|          x|               8|
|       operator|          x|              11|

2. awk变量定义

# awk -v NUM=3 -F: '{ print $NUM }' /etc/passwd
# awk -v NUM=3 -F: '{ print NUM }' /etc/passwd
# awk -v num=1 'BEGIN{print num}' 
1
# awk -v num=1 'BEGIN{print $num}' 
注意：
awk中调用定义的变量不需要加$

[root@node2 shell106]# awk -v NUM=3 -F: '{print NUM}' /etc/passwd
3
3
3


[root@node2 shell106]# awk -v NUM=3 -F: '{print $NUM}' /etc/passwd
0
1
2
3
4

[root@node2 shell106]# awk -v NUM=3 'BEGIN{print NUM};'
3
[root@node2 shell106]# awk -v NUM=3 'BEGIN{print NUM};' /etc/passwd
3

3. awk中BEGIN…END使用

①BEGIN：表示在程序开始前执行

②END ：表示所有文件处理完后执行

③用法：'BEGIN{开始处理之前};{处理中};END{处理结束后}'

㈠举例说明1

打印最后一列和倒数第二列（登录shell和家目录）

awk -F: 'BEGIN{ print "Login_shell\t\tLogin_home\n*******************"};{print $NF"\t\t"$(NF-1)};END{print "************************"}' 1.txt

awk 'BEGIN{ FS=":";print "Login_shell\tLogin_home\n*******************"};{print $NF"\t"$(NF-1)};END{print "************************"}' 1.txt

Login_shell		Login_home
************************
/bin/bash		/root
/sbin/nologin		/bin
/sbin/nologin		/sbin
/sbin/nologin		/var/adm
/sbin/nologin		/var/spool/lpd
/bin/bash		/home/redhat
/bin/bash		/home/user01
/sbin/nologin		/var/named
/bin/bash		/home/u01
/bin/bash		/home/YUNWEI
************************************

㈡举例说明2

打印/etc/passwd里的用户名、家目录及登录shell

u_name      h_dir       shell
***************************

***************************

awk -F: 'BEGIN{OFS="\t\t";print"u_name\t\th_dir\t\tshell\n***************************"};{printf "%-20s %-20s %-20s\n",$1,$(NF-1),$NF};END{print "****************************"}'


# awk -F: 'BEGIN{print "u_name\t\th_dir\t\tshell" RS "*****************"}  {printf "%-15s %-20s %-20s\n",$1,$(NF-1),$NF}END{print "***************************"}'  /etc/passwd

格式化输出：
echo		print
echo -n	printf

{printf "%-15s %-20s %-20s\n",$1,$(NF-1),$NF}


[root@node2 shell106]# awk -F: 'BEGIN{print "Login_shell\t\tLogin_home\n************************"};{print $NF"\t\t"$(NF-1) }END{print "********************************"}' 1.txt 



Login_shell             Login_home
************************
/bin/bash               /root
/sbin/nologin           /bin
/sbin/nologin           /sbin
/sbin/nologin           /var/adm
/sbin/nologin           /var/spool/lpd
/bin/sync               /sbin
/sbin/shutdown          /sbin
/sbin/halt              /sbin
/sbin/nologin           /var/spool/mail
/sbin/nologin           /root
********************************
[root@node2 shell106]#

4. awk和正则的综合运用

运算符	说明
==	等于
!=	不等于
>	大于
<	小于
>=	大于等于
<=	小于等于
~	匹配
!~	不匹配
!	逻辑非
&&	逻辑与
\|\|	逻辑或

㈠举例说明

从第一行开始匹配到以lp开头行
awk -F: 'NR==1,/^lp/{print $0 }' passwd  
从第一行到第5行          
awk -F: 'NR==1,NR==5{print $0 }' passwd
从以lp开头的行匹配到第10行       
awk -F: '/^lp/,NR==10{print $0 }' passwd 
从以root开头的行匹配到以lp开头的行       
awk -F: '/^root/,/^lp/{print $0}' passwd
打印以root开头或者以lp开头的行            
awk -F: '/^root/ || /^lp/{print $0}' passwd
awk -F: '/^root/;/^lp/{print $0}' passwd
显示5-10行   
awk -F':' 'NR>=5 && NR<=10 {print $0}' /etc/passwd     
awk -F: 'NR<10 && NR>5 {print $0}' passwd 

打印30-39行以bash结尾的内容：
[root@MissHou shell06]# awk 'NR>=30 && NR<=39 && $0 ~ /bash$/{print $0}' passwd 
stu1:x:500:500::/home/stu1:/bin/bash
yunwei:x:501:501::/home/yunwei:/bin/bash
user01:x:502:502::/home/user01:/bin/bash
user02:x:503:503::/home/user02:/bin/bash
user03:x:504:504::/home/user03:/bin/bash

[root@MissHou shell06]# awk 'NR>=3 && NR<=8 && /bash$/' 1.txt  
stu7:x:1007:1007::/rhome/stu7:/bin/bash
stu8:x:1008:1008::/rhome/stu8:/bin/bash
stu9:x:1009:1009::/rhome/stu9:/bin/bash

打印文件中1-5并且以root开头的行
[root@MissHou shell06]# awk 'NR>=1 && NR<=5 && $0 ~ /^root/{print $0}' 1.txt
root:x:0:0:root:/root:/bin/bash
[root@MissHou shell06]# awk 'NR>=1 && NR<=5 && $0 !~ /^root/{print $0}' 1.txt
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin


理解;号和||的含义：
[root@MissHou shell06]# awk 'NR>=3 && NR<=8 || /bash$/' 1.txt
[root@MissHou shell06]# awk 'NR>=3 && NR<=8;/bash$/' 1.txt


打印IP地址
# ifconfig eth0|awk 'NR>1 {print $2}'|awk -F':' 'NR<2 {print $2}'    
# ifconfig eth0|grep Bcast|awk -F':' '{print $2}'|awk '{print $1}'
# ifconfig eth0|grep Bcast|awk '{print $2}'|awk -F: '{print $2}'


# ifconfig eth0|awk NR==2|awk -F '[ :]+' '{print $4RS$6RS$8}'
# ifconfig eth0|awk -F"[ :]+" '/inet addr:/{print $4}'

打印从以lp开头到以mail开头，部分的内容

[root@node2 shell106]# cat -n 1.txt 
     1  root:x:0:0:root:/root:/bin/bash
     2  bin:x:1:1:bin:/bin:/sbin/nologin
     3  daemon:x:2:2:daemon:/sbin:/sbin/nologin
     4  adm:x:3:4:adm:/var/adm:/sbin/nologin
     5  lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
     6  sync:x:5:0:sync:/sbin:/bin/sync
     7  shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
     8  halt:x:7:0:halt:/sbin:/sbin/halt
     9  mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
    10  operator:x:11:0:operator:/root:/sbin/nologin
[root@node2 shell106]# awk '/^lp/,/^mail/{print $0}' 1.txt 
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
[root@node2 shell106]#

匹配以lp开头，或者匹配以mail开头的，然后打印

[root@node2 shell106]# awk '/^lp/||/^mail/{print $0}' 1.txt 
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
[root@node2 shell106]#

；分号是用来分隔命令的，匹配以lp开头，然后打印；匹配以mail开头，然后打印
虽然和上面的输出效果一样，但是执行过程是不同的

[root@node2 shell106]# awk '/^lp/;/^mail/{print $0}' 1.txt 
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
[root@node2 shell106]# 



[root@node2 shell106]# awk '/^lp/{print $0};/^mail/{print $0}' 1.txt 
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
[root@node2 shell106]#

匹配3-6行，且 $0 表示每一行, 表示匹配, / n o l o g in$ / 表示以nologin结尾的行

[root@node2 shell106]# awk 'NR>=3 && NR<=6 && $0 ~/nologin$/{print $0}' 1.txt 
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
[root@node2 shell106]#

打印ip


[root@node2 shell106]# ifconfig enp0s3
enp0s3: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>  mtu 1500
        inet 10.1.218.26  netmask 255.255.255.0  broadcast 10.1.218.255
        inet6 fe80::7fc4:e393:bddd:40e5  prefixlen 64  scopeid 0x20<link>
        ether 08:00:27:f1:33:6b  txqueuelen 1000  (Ethernet)
        RX packets 560907  bytes 44681470 (42.6 MiB)
        RX errors 0  dropped 0  overruns 0  frame 0
        TX packets 766645  bytes 129751578 (123.7 MiB)
        TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0



[root@node2 shell106]# ifconfig enp0s3|awk 'NR==2{print $2}'
10.1.218.26




[root@node2 shell106]# ifconfig enp0s3|awk 'NR>1{print $2}'
10.1.218.26
fe80::7fc4:e393:bddd:40e5
08:00:27:f1:33:6b
packets
errors
packets
errors

[root@node2 shell106]# ifconfig enp0s3|awk 'NR>1{print $2}'|awk 'NR==1'
10.1.218.26

在这里插入图片描述

5.课堂练习

显示可以登录操作系统的用户所有信息从第7列匹配以bash结尾，输出整行（当前行所有的列）

[root@MissHou ~] awk '/bash$/{print $0}'    /etc/passwd
[root@MissHou ~] awk '/bash$/{print $0}' /etc/passwd
[root@MissHou ~] awk '/bash$/' /etc/passwd
[root@MissHou ~] awk -F: '$7 ~ /bash/' /etc/passwd
[root@MissHou ~] awk -F: '$NF ~ /bash/' /etc/passwd
[root@MissHou ~] awk -F: '$0 ~ /bash/' /etc/passwd
[root@MissHou ~] awk -F: '$0 ~ /\/bin\/bash/' /etc/passwd

显示可以登录系统的用户名

# awk -F: '$0 ~ /\/bin\/bash/{print $1}' /etc/passwd

打印出系统中普通用户的UID和用户名

500	stu1
501	yunwei
502	user01
503	user02
504	user03


# awk -F: 'BEGIN{print "UID\tUSERNAME"} {if($3>=500 && $3 !=65534 ) {print $3"\t"$1} }' /etc/passwdUID	USERNAME


# awk -F: '{if($3 >= 500 && $3 != 65534) print $1,$3}' a.txt 
redhat 508
user01 509
u01 510
YUNWEI 511

六、awk的脚本编程

㈠流程控制语句

① if结构

if语句：

if [ xxx ];then
xxx
fi

格式：
awk 选项 '正则，地址定位{awk语句}'  文件名

{ if(表达式)｛语句1;语句2;...｝}

awk -F: '{if($3>=500 && $3<=60000) {print $1,$3} }' passwd

# awk -F: '{if($3==0) {print $1"是管理员"} }' passwd 
root是管理员

# awk 'BEGIN{if('$(id -u)'==0) {print "admin"} }'
admin

[root@node2 shell106]# awk -F: '{print "用户名:"$1 1"\t用户uid:"$3}' 1.txt 
用户名:root1    用户uid:0
用户名:bin1     用户uid:1
用户名:daemon1  用户uid:2
用户名:adm1     用户uid:3
用户名:lp1      用户uid:4
用户名:sync1    用户uid:5
用户名:shutdown1        用户uid:6
用户名:halt1    用户uid:7
用户名:mail1    用户uid:8
用户名:operator1        用户uid:11
[root@node2 shell106]# 


如果是超级管理员显示打印
[root@node2 shell106]# awk -F: '{ if ( $3==0 ) {print "用户名:"$1 1"\t用户uid:"$3}}' 1.txt 
用户名:root1    用户uid:0



[root@node2 shell106]# awk -F: '{ if ( $3>=0 && $3<=50 ) {print "用户名:"$1 1"\t用户uid:"$3}}' 1.txt 
用户名:root1    用户uid:0
用户名:bin1     用户uid:1
用户名:daemon1  用户uid:2
用户名:adm1     用户uid:3
用户名:lp1      用户uid:4
用户名:sync1    用户uid:5
用户名:shutdown1        用户uid:6
用户名:halt1    用户uid:7
用户名:mail1    用户uid:8
用户名:operator1        用户uid:11
[root@node2 shell106]#

[root@node2 shell106]# awk 'BEGIN{ if ( `id -u`==0){print "admin"} }'
awk: cmd. line:1: BEGIN{ if ( `id -u`==0){print "admin"} }
awk: cmd. line:1:             ^ invalid char '`' in expression
awk: cmd. line:1: BEGIN{ if ( `id -u`==0){print "admin"} }
awk: cmd. line:1:             ^ syntax error
[root@node2 shell106]# awk 'BEGIN{ if ( $(id -u)==0){print "admin"} }'
admin

② if…else结构

if...else语句:
if [ xxx ];then
	xxxxx
	
else
	xxx
fi

格式：
{if(表达式)｛语句;语句;...｝else｛语句;语句;...}}

awk -F: '{ if($3>=500 && $3 != 65534) {print $1"是普通用户"} else {print $1,"不是普通用户"}}' passwd 

awk 'BEGIN{if( '$(id -u)'>=500 && '$(id -u)' !=65534 ) {print "是普通用户"} else {print "不是普通用户"}}'

[root@node2 shell106]# awk -F:  '{if($3==0){print $1" 是管理员" } else {print $1" 不是管理员"}}' 1.txt 
root 是管理员
bin 不是管理员
daemon 不是管理员
adm 不是管理员
lp 不是管理员
sync 不是管理员
shutdown 不是管理员
halt 不是管理员
mail 不是管理员
operator 不是管理员

③ if…elif…else结构

if [xxxx];then
	xxxx
elif [xxx];then
	xxx
....
else
...
fi


if...else if...else语句：

格式：
{ if(表达式1)｛语句;语句；...｝else if(表达式2)｛语句;语句；...｝else if(表达式3)｛语句;语句；...｝else｛语句;语句；...｝}

awk -F: '{ if($3==0) {print $1,":是管理员"} else if($3>=1 && $3<=499 || $3==65534 ) {print $1,":是系统用户"} else {print $1,":是普通用户"}}'


awk -F: '{ if($3==0) {i++} else if($3>=1 && $3<=499 || $3==65534 ) {j++} else {k++}};END{print "管理员个数为:"i "\n系统用户个数为:"j"\n普通用户的个数为:"k }'


# awk -F: '{if($3==0) {print $1,"is admin"} else if($3>=1 && $3<=499 || $3==65534) {print $1,"is sys users"} else {print $1,"is general user"} }' a.txt 

root is admin
bin is sys users
daemon is sys users
adm is sys users
lp is sys users
redhat is general user
user01 is general user
named is sys users
u01 is general user
YUNWEI is general user

awk -F: '{  if($3==0) {print $1":管理员"} else if($3>=1 && $3<500 || $3==65534 ) {print $1":是系统用户"} else {print $1":是普通用户"}}'   /etc/passwd


awk -F: '{if($3==0) {i++} else if($3>=1 && $3<500 || $3==65534){j++} else {k++}};END{print "管理员个数为:" i RS "系统用户个数为:"j RS "普通用户的个数为:"k }' /etc/passwd
管理员个数为:1
系统用户个数为:28
普通用户的个数为:27


# awk -F: '{ if($3==0) {print $1":是管理员"} else if($3>=500 && $3!=65534) {print $1":是普通用户"} else {print $1":是系统用户"}}' passwd 

awk -F: '{if($3==0){i++} else if($3>=500){k++} else{j++}} END{print i; print k; print j}' /etc/passwd

awk -F: '{if($3==0){i++} else if($3>999){k++} else{j++}} END{print "管理员个数: "i; print "普通用个数: "k; print "系统用户: "j}' /etc/passwd 

如果是普通用户打印默认shell，如果是系统用户打印用户名
# awk -F: '{if($3>=1 && $3<500 || $3 == 65534) {print $1} else if($3>=500 && $3<=60000 ) {print $NF} }' /etc/passwd

㈡循环语句

① for循环

打印1~5
for ((i=1;i<=5;i++));do echo $i;done

# awk 'BEGIN { for(i=1;i<=5;i++) {print i} }'
打印1~10中的奇数
# for ((i=1;i<=10;i+=2));do echo $i;done|awk '{sum+=$0};END{print sum}'
# awk 'BEGIN{ for(i=1;i<=10;i+=2) {print i} }'
# awk 'BEGIN{ for(i=1;i<=10;i+=2) print i }'

计算1-5的和
# awk 'BEGIN{sum=0;for(i=1;i<=5;i++) sum+=i;print sum}'
# awk 'BEGIN{for(i=1;i<=5;i++) (sum+=i);{print sum}}'
# awk 'BEGIN{for(i=1;i<=5;i++) (sum+=i);print sum}'

[root@node2 shell106]# for ((i=1;i<=5;i++));do echo $i;done
1
2
3
4
5

awk 中引用变量，不用$变量名方式

[root@node2 shell106]# awk 'BEGIN{ for (i=1;i<=5;i++){ print i }}'
1
2
3
4
5

[root@node2 shell106]# for ((i=1;i<=5;i++));do echo $i; done|awk '{sum+=$0};END{ print sum}'
15

awk中变量不需要申明

② while循环

打印1-5
# i=1;while (($i<=5));do echo $i;let i++;done

# awk 'BEGIN { i=1;while(i<=5) {print i;i++} }'
打印1~10中的奇数
# awk 'BEGIN{i=1;while(i<=10) {print i;i+=2} }'
计算1-5的和
# awk 'BEGIN{i=1;sum=0;while(i<=5) {sum+=i;i++}; print sum }'
# awk 'BEGIN {i=1;while(i<=5) {(sum+=i) i++};print sum }'

③ 嵌套循环

嵌套循环：
#!/bin/bash
for ((y=1;y<=5;y++))
do
	for ((x=1;x<=$y;x++))
	do
		echo -n $x	
	done
echo
done

awk 'BEGIN{ for(y=1;y<=5;y++) {for(x=1;x<=y;x++) {printf x} ;print } }'


# awk 'BEGIN { for(y=1;y<=5;y++) { for(x=1;x<=y;x++) {printf x};print} }'
1
12
123
1234
12345

# awk 'BEGIN{ y=1;while(y<=5) { for(x=1;x<=y;x++) {printf x};y++;print}}'
1
12
123
1234
12345

尝试用三种方法打印99口诀表：
#awk 'BEGIN{for(y=1;y<=9;y++) { for(x=1;x<=y;x++) {printf x"*"y"="x*y"\t"};print} }'

#awk 'BEGIN{for(y=1;y<=9;y++) { for(x=1;x<=y;x++) printf x"*"y"="x*y"\t";print} }'
#awk 'BEGIN{i=1;while(i<=9){for(j=1;j<=i;j++) {printf j"*"i"="j*i"\t"};print;i++ }}'

#awk 'BEGIN{for(i=1;i<=9;i++){j=1;while(j<=i) {printf j"*"i"="i*j"\t";j++};print}}'

循环的控制：
break		条件满足的时候中断循环
continue	条件满足的时候跳过循环
# awk 'BEGIN{for(i=1;i<=5;i++) {if(i==3) break;print i} }'
1
2
# awk 'BEGIN{for(i=1;i<=5;i++){if(i==3) continue;print i}}'
1
2
4
5

七、awk的算法运算

+ - * / %(模) ^(幂2^3)
可以在模式中执行计算，awk都将按浮点数方式执行算术运算
# awk 'BEGIN{print 1+1}'
# awk 'BEGIN{print 1**1}'
# awk 'BEGIN{print 2**3}'
# awk 'BEGIN{print 2/3}'

八、awk统计案例

1、统计系统中各种类型的shell

# awk -F: '{ shells[$NF]++ };END{for (i in shells) {print i,shells[i]} }' /etc/passwd

books[linux]++
books[linux]=1
shells[/bin/bash]++
shells[/sbin/nologin]++

/bin/bash 5
/sbin/nologin 6

shells[/bin/bash]++			a
shells[/sbin/nologin]++		b
shells[/sbin/shutdown]++	c

books[linux]++
books[php]++

[root@node2 shell106]# awk -F: '{shells[$NF]++};END{ for (i in shells) {print i, shells[i]}}' /etc/passwd/bin/sync 1
/bin/bash 22
/sbin/nologin 15
/sbin/halt 1
/sbin/shutdown 1
[root@node2 shell106]#

[root@node2 shell106]# ss -antp|grep 22 |awk '{states[$1]++};END{ for (i in states) {print i,states[i]}}'
LISTEN 2
ESTAB 2

2、统计网站访问状态

# ss -antp|grep 80|awk '{states[$1]++};END{for(i in states){print i,states[i]}}'
TIME_WAIT 578
ESTABLISHED 1
LISTEN 1

# ss -an |grep :80 |awk '{states[$2]++};END{for(i in states){print i,states[i]}}'
LISTEN 1
ESTAB 5
TIME-WAIT 25

# ss -an |grep :80 |awk '{states[$2]++};END{for(i in states){print i,states[i]}}' |sort -k2 -rn
TIME-WAIT 18
ESTAB 8
LISTEN 1

3、统计访问网站的每个IP的数量

# netstat -ant |grep :80 |awk -F: '{ip_count[$8]++};END{for(i in ip_count){print i,ip_count[i]} }' |sort


# ss -an |grep :80 |awk -F":" '!/LISTEN/{ip_count[$(NF-1)]++};END{for(i in ip_count){print i,ip_count[i]}}' |sort -k2 -rn |head

4、统计网站日志中PV量

统计Apache/Nginx日志中某一天的PV量 　<统计日志>
# grep '27/Jul/2017' mysqladmin.cc-access_log |wc -l
14519

统计Apache/Nginx日志中某一天不同IP的访问量　<统计日志>
# grep '27/Jul/2017' mysqladmin.cc-access_log |awk '{ips[$1]++};END{for(i in ips){print i,ips[i]} }' |sort -k2 -rn |head

# grep '07/Aug/2017' access.log |awk '{ips[$1]++};END{for(i in ips){print i,ips[i]} }' |awk '$2>100' |sort -k2 -rn

名词解释：

网站浏览量（PV）
名词：PV=PageView (网站浏览量)
说明：指页面的浏览次数，用以衡量网站用户访问的网页数量。多次打开同一页面则浏览量累计。用户每打开一个页面便记录1次PV。

名词：VV = Visit View（访问次数）
说明：从访客来到您网站到最终关闭网站的所有页面离开，计为1次访问。若访客连续30分钟没有新开和刷新页面，或者访客关闭了浏览器，则被计算为本次访问结束。

独立访客（UV）
名词：UV= Unique Visitor（独立访客数）
说明：1天内相同的访客多次访问您的网站只计算1个UV。

独立IP（IP）
名词：IP=独立IP数
说明：指1天内使用不同IP地址的用户访问网站的数量。同一IP无论访问了几个页面，独立IP数均为1

作业1：
1、写一个自动检测磁盘使用率的脚本，当磁盘使用空间达到90%以上时，需要发送邮件给相关人员
2、写一个脚本监控系统内存和交换分区使用情况

作业2：
输入一个IP地址，使用脚本判断其合法性：
必须符合ip地址规范，第1、4位不能以0开头，不能大于255不能小于0

#八、企业实战案例