在上一篇文章中,我们详细讲了awk的结构化命令。
主要有以下几种:
- 条件控制语句:IF 、IF - ELSE 、IF - ELSE - IF
- 循环语句:For、While
- 循环结束语句:Break、Continue、Exit
担心大家可能也想练习以下具体的文本操作。下面通过一个简单的示例代码,继续分享。
基础学习,可以回头查看:Linux文本处理三剑客:awk(结构化命令)
1.前期准备
首先为下面的示例代码,创建一个为file.txt的
文件,内容可以是任意文本文件,例如:
姓名 性别 年龄
张三 男 20
李四 女 21
王五 男 22
赵老六 女 21
钱老七 男 25
示例代码
2. 使用 if 判断行数
# 打印行号大于 5 的行
awk '{ if (NR > 5) print }' file.txt
输出结果
钱老七 男 25
3. 使用 if-else 判断字段值
Awk
# 根据性别打印不同的信息,$2表示第二列变量
awk '{ if ($2 == "男") print "先生"; else print "女士" }' file.txt
输出结果
女士
先生
女士
先生
女士
先生
4. 使用 for 循环遍历数组
# 统计每个单词出现的次数
awk '{ for (i=1; i<=NF; i++) { count[$i]++; } } END { for (i in count) { print i, count[i] } }' file.txt
输出结果
王五 1
男 3
年龄 1
赵老六 1
姓名 1
女 2
李四 1
20 1
21 2
22 1
性别 1
钱老七 1
张三 1
25 1
5. 使用 while 循环读取文件
# 读取文件内容并逐行打印
awk '{
while (getline < "file.txt" > 0) {
print $0;
}
}' file.txt
输出结果
姓名 性别 年龄
张三 男 20
李四 女 21
王五 男 22
赵老六 女 21
钱老七 男 25
6. 使用 break 退出循环
awk 'BEGIN {
sum = 0
while ((getline line < "file.txt") > 0) {
split(line, fields, " ") # 使用空格分割每行内容到数组fields
sum += fields[3] # 将第二个字段的值加到sum中
if (sum > 50) break
else print "Sum =", sum
}
}'
awk
会在 BEGIN
块中逐行读取 file.txt
的内容,使用 split
函数将每行内容以空格分割到 fields
数组中,然后将第二个字段的值加到 sum
变量中。如果 sum
的值超过了 50,就会跳出循环。
输出结果
Sum = 0
Sum = 20
Sum = 41
7. 使用 continue 跳过本次循环
awk 'BEGIN {
sum = 0
while ((getline line < "file.txt") > 0) {
split(line, fields, " ") # 使用空格分割每行内容到数组fields
sum += fields[3] # 将第二个字段的值加到sum中
if (sum > 50) continue
else print "Sum =", sum
}
}'
如果 sum
的值超过了 50,就会执行 continue
语句,跳过本次循环的剩余部分,继续到下一行。
输出结果
Sum = 0
Sum = 20
Sum = 41
8. 使用 exit 退出程序
# 如果行号大于5则退出程序
awk '{ if (NR <= 5) print; else exit }' file.txt
在这个awk命令中,NR
是awk中的一个特殊变量,表示当前行号。上面的命令会打印file.txt
文件的前五行,一旦行号超过5,就会执行exit
语句来退出awk的执行,达到类似于break
的效果在这个awk命令中,NR
是awk中的一个特殊变量,表示当前行号。上面的命令会打印file.txt
文件的前五行,一旦行号超过5,就会执行exit
语句来退出awk的执行,达到类似于break
的效果
输出结果
姓名 性别 年龄
张三 男 20
李四 女 21
王五 男 22
赵老六 女 21
注意
- 以上示例代码仅供参考,请根据实际情况进行修改。
- 在编写 awk 脚本时,请注意空格和分号的使用。
- "break"、"continue" 语句只能在循环或 switch 语句中使用,如果在这些结构之外使用,就会产生错误。
如果您觉得有些用处,熟练操作这些代码后,相信你会有一些收获。
欢迎在评论区留言,关注。谢谢您的阅读!
敬请关注!
往期学习笔记: