在linux/unix系统,一款强大的编辑工具,可以在无交互的情况下实现相当复杂的文本操作,完成各种自动化配置任务。
常见用法:
通常情况下 awk 所使用的命令格式如下所示,其中,单引号加上大括号“{}”用于设置对数据 进行的处理动作。awk 可以直接处理目标文件,也可以通过“-f”读取脚本对目标文件进行处理。
awk 选项 '模式或条件{编辑指令}' 文件1 文件2
(过滤并输出文件符条件的内容)
awk -f 脚本|文件1
(从脚本中调用编辑指令,过滤并输出内容)
sed 命令常用于一整行的处理,而awk 比较倾向于将一行分成多个“字段”然后再进行 处理,且默认情况下字段的分隔符为空格或者 tab 键
awk 执行结果可以通过 print 的功能将字段数 据打印显示。在使用 awk 命令的过程中,可以使用逻辑操作符“&&”,表示“与”,“|”表示“或“ “!”表示“非”;还可以进行简单的数学运算,如+、 一、*、/、%、^分别表示加、减、乘、除、取 余和乘方。
-F 指定分隔符
$ cat file.txt
John:Doe:25:USA
Jane:Smith:30:Canada
Mark:Johnson:40:UK
$ awk -F: '{ print $1 }' file.txt
John
Jane
Mark
$ awk -F: '{ print $3 }' file.txt
25
30
40
$ awk -F: '{ print $2, $4 }' file.txt
Doe USA
Smith Canada
Johnson UK
awk {print} file.txt
(查看所有内容)
John:Doe:25:USA
Jane:Smith:30:Canada
Mark:Johnson:40:UK
awk 从输入文件或者标准输入中读入信息,与sed一样,信息的读入也是逐行读取的。不同的是
awk 将文本文件中的一行视为一个记录,而将一行中的某一部分(列)作为记录中的一个字段(域)为了操作这些不同的字段 awk 借用 shell 中类似于位置变量的方法,用S1、S2、S3…顺序地表示行 (记录)中的不同字段。另外awk 用SO表示整个行(记录)。不同的字段之间是通过指定的字符分隔。 awk 默认的分隔符是空格。awk 允许在命令行中用“-F 分隔符”的形式来指定分隔符。
awk 包含几个特殊的内建变量(可直接用)
FS | 指定每行文本的字段分隔符,默认为空格或制表位。 |
NF | 当前处理的行的字段个数。 |
NR | 当前处理的行的行号(序数)。 |
SO | 当前处理的行的整行内容。 |
Sn | 当前处理行的第n 个 字 段 ( 第n 列)。 |
FILENAME | 被处理的文件名。 |
RS | 数据记录分隔,默认为\n, 即每行为一条记录. |