含义及参数
awk是一种编程语言,用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入(stdin)、一个或多个文件,或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能,是linux/unix下的一个强大编程工具。它在命令行中使用,但更多是作为脚本来使用。awk有很多内建的功能,比如数组、函数等,这是它和C语言的相同之处,灵活性是awk最大的优势。
awk读取输出,或者文件的方式是一行,一行的读,根据你给出的条件进行查找,并在找出来的行中进行操作,感觉他的设计思想,真的很简单,但是结合实际情况,具体操作起来就没有那么简单了。他有三种形势,awk,gawk,nawk,平时所说的awk其实就是gawk。
常用参数 | 含义 |
---|---|
-F | 紧跟分隔符,表示读入的字段以输入的分隔符分割,默认是空格 |
-v | 进入变量模式 可以进行变量的赋值及调用(调用不需要加$符) |
$n | 当前记录的第n个字段,比如n为1表示第一个字段,n为2表示第二个字段 |
$0 | 这个变量包含执行过程中当前行的文本内容 |
BEGIN{} | 读入第一行文本之前执行 , 一般用来初始化操作 |
{} | 逐行处理 , 逐行读入文本执行相应的处理 , 是最常见的编辑指令 |
END{} | 处理完最后一行文本之后执行 , 一般用来输出处理结果 |
^ | 以什么开头 |
$ | 以什么结尾 |
! | 非,一般在条件的最前面 |
NR | 行 |
NF | 列 |
// | 两个/里面写的是匹配条件 |
$6~ /bin$/ | 第6列的内容是bin结尾 |
$6!~/bin$/ | 第6列的内容不是bin结尾 |
示例
同样的,我们用/etc/passwd进行实验cp /etc/passwd /mnt
在开头通过n++表示行号,也可以通过NR,表示每行行号,NF表示分隔后多少列数。
awk的简单运算操作
匹配出家目录为/bin的内容:
两种方法:
解决实际问题
- Q:统计以nologin(非交互式登陆的)用户有多少行?
- A:两种思路,方法一,通过匹配到相关的行,最后用wc -l统计行数;方法二,通过awk直接定义一个变量,然后变量随着匹配递增,最后END打印出变量,就是最后统计的行数。
- Q:把家目录不在/home下的用户统计出来并显示名字
- A:我们以:为分隔符,对第6列条件进行匹配,注意$6!~//这是一个匹配条件与另一个条件需要用条件连接符号连接起来。
- Q:写一个脚本,如果网卡设备存在,抓取他的ip,如果不存在,打印错误。
- A:查看网卡设备IP,我们自然想到ifconfig+设备名,那么首先观察ifconfig的输出,我们发现需要的是inet后面的内容,那么就需要匹配到inet这一行,输出以空格为分割符号的第二个元素。除此之外,我们利用test加上条件判断。
- Q:写一个脚本:只有root用户可以清空所有日志!
- A:首先,使用test 判断$USER是否等于root,否则退出;接着,观察所有日志的配置文件/etc/rsyslog,可以只用awk 将以#开头、以$开头以及空行反向匹配掉,然后使用sed 命令把-删除,把:开头的行删除掉。注意,这个时候最好用$( )来做命令替换,即先运行。将替换后的命令复制给变量,以此变量值为for循环的边界值。
注意:关于shell中的``和$( )的区别,请看这篇博客。
或者: