shell脚本中awk

本文详细介绍了awk/gawk命令,包括其作为文本处理工具的基本概念,如记录、字段和规则。awk/gawk通过模式匹配执行操作,常用于处理文本文件。文中列举了awk的语法格式、正则表达式、流程控制语句以及内部变量的使用,并提供了多个实际示例,如条件判断、循环和输出函数。此外,还探讨了如何从标准输入或与其他命令结合使用awk/gawk。
摘要由CSDN通过智能技术生成

什么是awk/gawk ?
awk是一种程序设计语言,主要用来处理数据和产生报表。
它对输入数据(文件、标准输入或命令的输出)逐行进行扫描,匹配指定的模式(pattern),并执行指定的操作(action)。
gawk是GNU下开发的awk,经过不断改进和更新,现已包含awk的所有功能。

awk/gawk的主要功能就是处理文本文件的数据,
它是通过自动将变量分配给每行的每个数据元素实现这一功能。

awk/gawk编程基础知识——记录、字段(域)和规则
记录
记录是单个的、连续长度的输入数据,是awk的操作对象。记录由记录分隔符限定,记录分隔符是一个字符串,并且定义为RS变量。在缺省情况下,RS的值设置为换行符,所以awk的缺省行为是将整行输入作为记录。
字段(域)
将每个记录进一步分解为称作字段的单独的块。字段受字段分隔符FS限定。缺省的字段分隔符是任意数量的空白字符,包括制表符和空格字符。所以在缺省情况下,将输入行进一步分解为单独的单词(由空白字符分隔的任何字符组)
规则
规则是一些模式,后面跟着由换行分隔的操作。当awk执行一条规则时,它在输入记录中搜索给定模式的匹配项,然后对这些记录执行给定的操作(可以在规则中省略模式或操作):/pattern/ { action }
请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述

请添加图片描述
首先建一个stu.txt
请添加图片描述
请添加图片描述
请添加图片描述

-F:指定分隔符,可省略(默认空格或Tab位)

-V:调用外部Shell变量  variable

请添加图片描述
![请添加图片描述](https://img-blog.csdnimg.cn/0f052dff87564ef184c87fac879314f3.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBA5Lmd6ZiI, size_20,color_FFFFFF,t_70,g_se,x_16)

awk的语法格式
语法格式
简要语法:awk/gawk ‘pattern {action}’ filename
完整语法:请添加图片描述
awk/gawk扫描filename中的每一行, 对符合模式pattern的行执行操作action。
awk/gawk程序是由多个pattern与action所组成,一个pattern后面跟一个Action。
Pattern(1) {Action(1)}
Pattern(2) {Action(2)}
Pattern(3) {Action(3)}
awk的语法格式

awk指令一定要用单引号括起
awk的动作一定要用花括号括起
模式可以是正则表达式、条件表达式或两种组合
多个动作之间用;分开

特例:
① gawk ‘pattern’ filename
显示所有符合模式pattern的行
awk ‘/bash/’ /etc/passwd
② gawk ‘{action}’ filename
对所有行执行操作action
who|awk ‘{print $2}’
pattern
awk中有如下几种Pattern:
(1)/regular expression/:正则表达式,是一个用斜线包围的Pattern.
例:

awk '/wang/{print "found wang\n" $2,$6}'  stu.txt

(2)expression:当该表达式的值不为 0 或一个不是空的字串,则可视为符合.

 awk ‘$6>=60 {print $2  “\t”  $6}

Action
对所读取的记录进行某种特定的操作,由一条或多条语句或命令组成 ,语句、命令之间用分号进行分隔。
Action中的算式有算术、比较、布尔、条件。
Action中的语句可以是流程控制语句:
(1)if条件判断语句
(2)while循环语句
(3)do-while循环语句
(4)for循环语句
(5)break语句
(6)continue语句
(7)next、next file 、exit语句
Action流程控制语句— if表达式

if (expression){
   commands
   }
   else{
   commands
    }

例如

 awk '{
        if ($6<60) {print $6}
        else {print $2":"$6}
        }' stu.txt

请添加图片描述

Action流程控制语句—while循环

while 循环的语法如下:while (expression){
                               commands
                               }

例如

awk 'BEGIN{i=1}
     {
       while(i<=NR)
       {i++;
        if($6>60 &&  NR>=2)
        {print $6}
       }
      }'  stu.txt

Action流程控制语句—nextexit
next 和exit
next 指令用来告诉gawk 处理文件中的下一个记录,而不管现在正在做什么。语法如下:
{command1
command 2
command 3
next
command 4
}
程序只要执行到next指令,就跳到下一个记录从头执行命令。command4指令永远不会被执行。
程序遇到exit指令后,就转到程序的末尾去执行END,如果有END的话。

awk ‘{ if ($6>60) next;else sum+=$6;}
           END {printf “sum=%d\n”,sum}’ stu.txt   统计不及格的和
Exit:只要有不及格的就打印提示  exit.sh

自动内部变量
awk的每次执行,都建立了一些缺省的变量,也叫做内部变量,这些变量有固定的名字和固定的含义,它们在程序运行期间可以随时被引用。其具体定义如下:
FS: 输入记录字段间的分隔符(默认是空格和制表符)
RS: 输入记录的分隔符(默认是NEWLINE)
OFS: 输出记录字段间的分隔符(默认是空格)
ORS: 输出记录的分隔符(默认是NEWLINE)
NR: 当前行数
NF: 当前记录字段数
ARGC: 命令行参数个数
ARGV: 命令行参数数组
自动内部变量–OFS
请添加图片描述
awk/gawk常用输出函数
1、print函数:
用于不需要复杂格式的简单输出,print 格式:print item1, item2, …
例如:

$ ps -e |  gawk ‘/ 05 /  {print “tty05: ”  $4, $1}

(查看5号终端上的用户现在在干什么及其PID)
在这里插入图片描述
2、printf函数:
高级格式化输出函数. 用法与C语言中相同.
格式: printf (format, item1, item2, …)
实例: ps | gawk '{if(NR!=1)printf "PID:%5d\t\t%s\n",$1,$4}'
在这里插入图片描述
输入
1、从标准输入设备(键盘)输入
格式: gawk ‘pattern {action}’
由于未指定输入数据来源, 缺省情况下从标准输入设备(键盘)读取数据. 键盘上每输入一行, gawk就处理一行, 直到结束进程。
例:

、从其它命令输入
格式: command | gawk ‘pattern’
command | gawk ‘{action}’
command | gawk ‘pattern {action}’
例:
在这里插入图片描述
推荐https://blog.csdn.net/jsut_rick/article/details/78287744

### 回答1: awk是一种文本处理工具,常用于shell脚本。它可以读取文本文件,对每一行进行处理,并输出结果。awk的基本语法为: awk 'pattern {action}' file 其,pattern是一个正则表达式,用于匹配文本的某些行;action是一个命令序列,用于对匹配到的行进行处理。awk会自动将每一行分割成若干个字段,可以通过$1、$2等变量来访问这些字段。例如,以下命令可以输出文件第一列的内容: awk '{print $1}' file 除了基本语法外,awk还有很多高级用法,例如可以使用内置函数、变量、数组等。可以参考awk的官方文档或其他教程来学习更多内容。 ### 回答2: awk是一种文本处理工具,在shell脚本经常用于对数据文件进行处理。它可以对文件进行逐行扫描,并按照指定的规则进行分割、匹配和处理。以下是awkshell脚本的用法详解: 1. 基本语法 awk 'pattern { command }' filename 其,pattern是匹配模式,用于匹配文件的文本;command是要执行的命令,可以是一行或多行。filename是要处理的文件名。 2. 变量 在awk有很多内置变量可以使用,例如: - $0:表示整行文本 - $1, $2, $3...:表示第一、二、三列文本 - NF:表示当前行的列数 - NR:表示当前行的行号 - FS:表示字段分隔符,默认为制表符或空格 可以使用这些变量来进行数据的处理和统计。 3. 示例 下面是一些常用的awk示例: (1)从文件抽取出第一列 $ awk '{print $1}' file.txt (2)统计文件每行的单词数 $ awk '{print NF}' file.txt (3)筛选出文件包含关键词的行 $ awk '/keyword/' file.txt (4)计算文件各列的和 $ awk '{sum += $1 + $2 + $3} END {print sum}' file.txt (5)替换文本的字符串 $ awk '{gsub("oldstring", "newstring")}1' file.txt 4. 总结 awk是一种非常强大的文本处理工具,它能够根据指定的模式从文本提取信息,并对其进行处理和统计。熟练掌握awk的使用可以让我们更轻松地处理和分析大量文本数据。 ### 回答3: Shell脚本是编程语言之一,它可以利用awk命令来处理和分析文本数据。awk命令是Linux/Unix系统经常使用的一个工具,可以对文本文件或标准输入数据进行扫描、过滤、处理和分析,从而很好地完成文本处理的任务。 在Shell脚本,使用awk命令需要按照如下结构: ```bash awk 'commands' filename ``` 其,`commands`是awk命令的参数,可以是简单的字符串或复杂的处理脚本。`filename`是需要处理和分析的文件名或者通过管道传输的标准输入数据。 awk命令的一些常用参数和语法如下: 1. `awk '{pattern + action}' filename`:在文件搜索指定的模式或文本,并对匹配模式的行执行指定的操作。 2. `awk '{print $n}' filename`:将文件的某列数据提取出来进行打印输出,$1表示第一列数据,$2表示第二列数据,以此类推。 3. `awk -F: '{print $1,$3}' filename`:指定文件的分隔符为“:”,然后提取文件的第一列和第三列数据。 4. `awk '{sum+=$1} END {print sum}' filename`:计算文件的数据列的总和值,并进行输出。 5. `awk '/re/ {print $0}' filename`:搜索指定的正则表达式re,并将匹配的行输出。 6. `awk '{if($1="xxx") print $0}' filename`:对文件的指定数据列进行筛选,符合条件就进行输出。 以上是awk命令的一些常用参数和语法,值得注意的是,awk命令非常强大,可以完成很多复杂的文本处理和数据分析,几乎可以操作所有的文本数据。所以,对于Shell脚本awk用法,需要根据具体的需求和场景进行灵活运用和学习。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值