一、awk简介:
在 Linux/UNIX 系统中,awk 是一个功能强大的编辑工具,逐行读取输入文本,并根据指定的匹配模式进行查找,对符合条件的内容进行格式化输出或者过滤处理,可以在无交互的情况下实现相当复杂的文本操作,被广泛应用于 Shell 脚本,完成各种自动化配置任务。
二、常见用法:
单引号加上大括号“{}”用于设置对数据进行的处理动作。awk 可以直接处理目标文件,也可以通过“-f”读取脚本对目标文件进行处理。
awk 将文本文件中的一行视为一个记录,而将一行中的某一部分(列)作为记录中的一个字(域)。为了操作这些不同的字段,awk 借用 shell 中类似于位置变量的方法, 用$1、$2、$3…顺序地表示行(记录)中的不同字段。另外 awk 用$0 表示整个行(记录)。不同的字段之间是通过指定的字符分隔。awk 默认的分隔符是空格。awk 允许在命令行中用“-F 分隔符”的形式来指定分隔符。
- awk 【选项】‘模式或条件 {编辑指令}’ 文件1 文件2
- awk -f 脚本文件 文件1 文件2
(1)特殊的内建变量(可直接用)
- FS:指定每行文本的字段分隔符,默认为空格或制表位(tab键);
- NF:当前处理的行的字段个数;
- NR:当前处理的行的行号(序数);
- $0:当前处理的行的整行内容;
- $n:当前处理行的第 n 个字段(第 n 列);
- FILENAME:被处理的文件名;
- RS:数据记录分隔,默认为\n,即每行为一条记录;
操作示例:按行输出文本,为了方便说明,准备了一个名为zzz.txt的文件,内容如下:
操作示例:按字段输出文本
(2)关系运算符号:只有当条件为真,才执行指定的动作。
- 大于(>);小于(<);大于等于(>=);小于等于(<=);
- 等于(==)、不等于(!=);
- &&(与)、||(或)、!(非);
- 加(+)、减(-)、乘(*)、除(/)、取余(%)、乘方(^);
(3)通过管道、双引号调用 shell 命令
注意:getline命令
1.当getline左右没有重定向符|或<时,getline读去当前文件的第一行并将数据保存到变量中,如果没有变量,则数据保存到$0中;由于awk在处理getline之前已经读入了一行,所以getline得到的返回结果是隔行的。
2.当getline左右有重定向符|或<时,getline作用于定向输入文件,由于该文件是刚打开,awk并没有读入一行数据,而getline读入了一行数据,那么getline返回的是该文件的第一行,而不是隔行。