awk 包含字符串_awk 使用，Linux 三剑客之一

最新推荐文章于 2023-06-28 10:23:27 发布

知乎盐选创作者

最新推荐文章于 2023-06-28 10:23:27 发布

阅读量587

点赞数

文章标签： awk 包含字符串

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_27009347/article/details/113045983

版权

Awk提供了另一个内建变量, 叫做 NR, 它会存储当前已经读取了多少行的计数. 我们可以使用 NR 和 $0 给 emp.data 的没一行加上行号: { print NR, $0 }

{ print "total pay for", $1, "is", $2 * $3 }

NF, 字段数量

很显然你可能会发现你总是需要通过 $1, $2 这样来指定不同的字段, 但任何表达式都可以使用在$之后来表达一个字段的序号; 表达式会被求值并用于表示字段序号. Awk会对当前输入的行有多少个字段进行计数, 并且将当前行的字段数量存储在一个内建的称作 NF 的变量中. 因此, 下面的程序

{ print NF, $1, $NF }

printf 语句中的规格字符串包含两个 % 规格。第一个是 %s ，说明以字符串的方式打印第一个值 $1 。第二个是 %.2f ，说明以数字的方式打印第二个值 $2*$3 ，并保留小数点后面两位。规格字符串中其他东西，包括美元符号，仅逐字打印。字符串尾部的 n 代表开始新的一行，使得后续输出将从下一行开始。以 emp.data 为输入，该程序产生：

{ printf("total pay for %s is $%.2fn", $1, $2 * $3) }

第一个规格 %-8s 将一个姓名以字符串形式在8个字符宽度的字段中左对齐输出。第二个规格 %6.2f 将薪酬以数字的形式，保留小数点后两位，在6个字符宽度的字段中输出。

{ printf("%-8s $%6.2fn", $1, $2 * $3) }

排序输出

假设你想打印每位员工的所有数据，包括他或她的薪酬，并以薪酬递增的方式进行排序输出。最简单的方式是使用awk将每位员工的总薪酬置于其记录之前，然后利用一个排序程序来处理awk的输出。Unix上，命令行如下:

awk '{ printf("%6.2f %sn", $2 * $3, $0) }' emp.data | sort

通过计算选择

程序

$2 * $3 > 50 { printf("$%.2f for %sn", $2 * $3, $1) }

打印出总薪资超过50美元的员工的薪酬。

通过文本内容选择

除了数值测试，你还可以选择包含特定单词或短语的输入行。这个程序会打印所有第一个字段为 Susie 的行：:

$1 == "Susie"

操作符 == 用于测试相等性。你也可以使用称为正则表达式的模式查找包含任意字母组合，单词或短语的文本。这个程序打印任意位置包含 Susie 的行：:

/Susie/

模式组合

可以使用括号和逻辑操作符与 && ，或 || ，以及非 ! 对模式进行组合。程序:

$2 >= 4 || $3 >= 20

数据验证

实际的数据中总是会存在错误的。在数据验证-检查数据的值是否合理以及格式是否正确-方面，Awk是个优秀的工具。

数据验证本质上是否定的：不是打印具备期望属性的行，而是打印可疑的行。如下程序使用对比模式将5个数据合理性测试应用于 emp.data 的每一行：:

NF != 3 { print $0, "number of fields is not equal to 3" }

$2 < 3.35 { print $0, "rate is below minimum wage" }

$2 > 10 { print $0, "rate exceeds $10 per hour" }

$3 < 0 { print $0, "negative hours worked" }

$3 > 60 { print $0, "too many hours worked" }

知乎盐选创作者

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
awk 包含字符串_awk 使用，Linux 三剑客之一

Awk提供了另一个内建变量, 叫做 NR, 它会存储当前已经读取了多少行的计数. 我们可以使用 NR 和 $0 给 emp.data 的没一行加上行号: { print NR, $0 }{ print "total pay for", $1, "is", $2 * $3 }NF, 字段数量很显然你可能会发现你总是需要通过 $1, $2 这样来指定不同的字段, 但任何表达式都可以使用在$之后来表达...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。