Linux文本处理三剑客:awk(对具体文本的示例代码)

在上一篇文章中,我们详细讲了awk的结构化命令。

主要有以下几种:

  • 条件控制语句:IF  、IF - ELSE 、IF - ELSE - IF
  • 循环语句:For、While
  • 循环结束语句:Break、Continue、Exit

 担心大家可能也想练习以下具体的文本操作。下面通过一个简单的示例代码,继续分享。

基础学习,可以回头查看:Linux文本处理三剑客:awk(结构化命令)

1.前期准备

首先为下面的示例代码,创建一个为file.txt的文件,内容可以是任意文本文件,例如:

姓名	性别	年龄
张三	男	20
李四	女	21
王五	男	22
赵老六	女	21
钱老七	男	25

示例代码

2. 使用 if 判断行数

# 打印行号大于 5 的行
awk '{ if (NR > 5) print }' file.txt

输出结果

钱老七	男	25

3. 使用 if-else 判断字段值

Awk

# 根据性别打印不同的信息,$2表示第二列变量
awk '{ if ($2 == "男") print "先生"; else print "女士" }' file.txt

输出结果

女士
先生
女士
先生
女士
先生

4. 使用 for 循环遍历数组

# 统计每个单词出现的次数
awk '{ for (i=1; i<=NF; i++) { count[$i]++; } } END { for (i in count) { print i, count[i] } }' file.txt

输出结果

王五 1
男 3
年龄 1
赵老六 1
姓名 1
女 2
李四 1
20 1
21 2
22 1
性别 1
钱老七 1
张三 1
25 1

5. 使用 while 循环读取文件

# 读取文件内容并逐行打印
awk '{
    while (getline < "file.txt" > 0) {
        print $0;
    }
}' file.txt

输出结果

姓名    性别    年龄
张三    男      20
李四    女      21
王五    男      22
赵老六  女      21
钱老七  男      25

6. 使用 break 退出循环

awk 'BEGIN {
   sum = 0
   while ((getline line < "file.txt") > 0) {
      split(line, fields, " ")  # 使用空格分割每行内容到数组fields
      sum += fields[3]  # 将第二个字段的值加到sum中
      if (sum > 50) break
      else print "Sum =", sum
   }
}' 

awk 会在 BEGIN 块中逐行读取 file.txt 的内容,使用 split 函数将每行内容以空格分割到 fields 数组中,然后将第二个字段的值加到 sum 变量中。如果 sum 的值超过了 50,就会跳出循环。 

输出结果

Sum = 0
Sum = 20
Sum = 41

7. 使用 continue 跳过本次循环

awk 'BEGIN {
   sum = 0
   while ((getline line < "file.txt") > 0) {
      split(line, fields, " ")  # 使用空格分割每行内容到数组fields
      sum += fields[3]  # 将第二个字段的值加到sum中
      if (sum > 50) continue
      else print "Sum =", sum
   }
}'

如果 sum 的值超过了 50,就会执行 continue 语句,跳过本次循环的剩余部分,继续到下一行。

输出结果

Sum = 0
Sum = 20
Sum = 41

8. 使用 exit 退出程序

# 如果行号大于5则退出程序
awk '{ if (NR <= 5) print; else exit }' file.txt

在这个awk命令中,NR是awk中的一个特殊变量,表示当前行号。上面的命令会打印file.txt文件的前五行,一旦行号超过5,就会执行exit语句来退出awk的执行,达到类似于break的效果在这个awk命令中,NR是awk中的一个特殊变量,表示当前行号。上面的命令会打印file.txt文件的前五行,一旦行号超过5,就会执行exit语句来退出awk的执行,达到类似于break的效果 

输出结果

姓名    性别    年龄
张三    男      20
李四    女      21
王五    男      22
赵老六  女      21

注意

  • 以上示例代码仅供参考,请根据实际情况进行修改。
  • 在编写 awk 脚本时,请注意空格和分号的使用。
  • "break"、"continue" 语句只能在循环或 switch 语句中使用,如果在这些结构之外使用,就会产生错误。

如果您觉得有些用处,熟练操作这些代码后,相信你会有一些收获。

欢迎在评论区留言,关注。谢谢您的阅读!

敬请关注!

往期学习笔记:

Windows系统开启Linux子系统(Ubuntu)

Linux常用命令(目录操作命令)

Linux常用命令:文件的创建、复制、移动、查找和删除命令

Linux常用命令:文本文件的查看与编辑

Linux常用命令:文本文件的拼接与分割

Linux常用命令:文件的权限管理

Linux常用命令:文件的下载、压缩与解压

Linux常用命令:常见的操作符

Linux常用命令:系统操作命令
 

 Linux文本处理三剑客:grep

Linux文本处理三剑客:sed

Linux文本处理三剑客:awk

Linux文本处理三剑客:awk(常用匹配模式)

Linux文本处理三剑客:awk(结构化命令)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

TiYong

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值