Shell 脚本之文本三剑客（awk）

Zzzzz1234...

已于 2023-11-29 17:00:50 修改

阅读量99

点赞数 1

文章标签： linux 运维服务器

于 2023-11-28 19:54:33 首次发布

本文链接：https://blog.csdn.net/Zmksaber/article/details/134647976

版权

一、什么是AWK

awk（语言）：读取一行处理一行，

在 Linux/UNIX 系统中，awk 是一个功能强大的编辑工具，逐行读取输入文本，默认以空格或tab键作为分隔符作为分隔，并按模式或者条件执行编辑命令。而awk比较倾向于将一行分成多个字段然后进行处理。AWK信息的读入也是逐行指定的匹配模式进行查找，对符合条件的内容进行格式化输出或者过滤处理，可以在无交互的情况下实现相当复杂的文本操作，被广泛应用于 Shell 脚本，完成各种自动化配置任务。

1.1工作原理

前面提到 sed 命令常用于一整行的处理,而 awk 比较倾向于将一行分成多个“字段”然后再进行处理，且默认情况下字段的分隔符为空格或 tab 键。awk 执行结果可以通过 print 的功能将字段数据打印显示。

1.2基本格式

awk  选项   '表达式（处理动作）'

选项：
-F 指定分隔符
-v 指定变量
-f 脚本

1.3awk常见的内置变量

awk 选项   '模式{print  }'

- FS :指定每行文本的字段分隔符，缺省为空格或制表符（tab）。与 “-F”作用相同  -v "FS=:"
- OFS：输出时的分隔符
- NF：当前处理的行的字段个数
- NR：当前处理的行的行号（序数）
- $0：当前处理的行的整行内容
- $n：当前处理行的第n个字段（第n列）
- FILENAME:被处理的文件名
- RS：行分隔符。awk从文件上读取资料时，将根据RS的定义就把资料切割成许多条记录，
而awk一次仅读入一条记录进行处理。预设值是\n

awk ‘{print $1}’ awk 内置变量和 shell环境中的变量可能会有冲突单引号的作用是不识别变量

NF显示字段个数

倒数第一列 $NF

倒数第二列 $(NF-1)

NR显示行号

1.4BEGIN END

BEGIN END 主要用于调整格式

BEGIN{}：仅在开始处理文件中的文本之前执行一次

END{}：仅在文本处理完成之后执行一次

1.5数组

awk数组特性：

awk的数组是关联数组(即key/value方式的hash数据结构)，索引下标可为数值(甚至是负数、小数等)，也可为字符串 1. 在内部，awk数组的索引全都是字符串，即使是数值索引在使用时内部也会转换成字符串 2. awk的数组元素的顺序和元素插入时的顺序很可能是不相同的
awk数组支持数组的数组

1.5.1 访问、赋值数组元素

索引可以是整数、负数、0、小数、字符串。如果是数值索引，会按照CONVFMT变量指定的格式先转换成字符串

例子：

1.5.2 遍历数组

格式：
for(var in array) {for-body}

1.6正则匹配

/regular expression/：仅处理能够模式匹配到的行，需要用/ /括起来

例子

awk   '/^UUID/{print $1}'     /etc/fstab

二、实验

提取ens33 的ip地址

打印偶数行

打印奇数行

提取ip地址和时间

三、面试题

1.统计/etc/fstab文件中每个文件系统类型出现的次数 1

2.统计/etc/fstab文件中每个真单词出现的次数

3.提取出字符串Yd$C@M05MB%9&Bdh7dq+YVixp3vpw中的所有数字

4.提取主机名并放入原文件 test.txt

http://mail.kgc.com/index.html

http://www.kgc.com/test.html

http://study.kgc.com/index.html

http://blog.kgc.com/index.html

http://www.kgc.com/images/logo.jpg

http://blog.kgc.com/20080102.html

http://www.kgc.com/images/kgc.jpg

5.查出/tmp/的权限，以数字方式显示

6.查出用户UID最大值的用户名、UID及shell类型

Zzzzz1234...

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Shell 脚本之文本三剑客（awk）

awk（语言）：读取一行处理一行，在 Linux/UNIX 系统中，awk 是一个功能强大的编辑工具，逐行读取输入文本，默认以空格或tab键作为分隔符作为分隔，并按模式或者条件执行编辑命令。而awk比较倾向于将一行分成多个字段然后进行处理。AWK信息的读入也是逐行指定的匹配模式进行查找，对符合条件的内容进行格式化输出或者过滤处理，可以在无交互的情况下实现相当复杂的文本操作，被广泛应用于 Shell 脚本，完成各种自动化配置任务。
复制链接

扫一扫