awk 入门_awk入门,强大的文本分析工具

awk 入门

Awk是用于Unix和类Unix系统的强大文本解析工具,但是由于它具有可用于执行常见解析任务的编程功能,因此它也被视为一种编程语言。 您可能不会使用awk开发下一个GUI应用程序,并且它可能不会代替您的默认脚本语言,但是它对于特定任务而言是强大的实用程序。

这些任务可能是令人惊讶的多样化。 发现awk可以最好地解决您的哪些问题的最好方法是学习awk。 您会惊讶于awk如何帮助您完成更多工作,却花费更少的精力。

Awk的基本语法为:

 awk [ options ] 'pattern {action}' file 

首先,请创建此示例文件并将其另存为colours.txt


   
   
name       color  amount
apple      red    4
banana     yellow 6
strawberry red    3
grape      purple 10
apple      green  8
plum       purple 2
kiwi       brown  4
potato     brown  9
pineapple  yellow 5

此数据被一个或多个空格分隔为列。 以某种方式组织要分析的数据是很常见的。 它不一定总是由空格分隔的列,甚至不是逗号或分号,但尤其是在日志文件或数据转储中,通常存在可预测的模式。 您可以使用数据模式来帮助awk提取和处理您要关注的数据。

打印列

在awk中, 打印功能将显示您指定的任何内容。 您可以使用许多预定义的变量,但是一些最常见的变量是指定文本文件中列的整数。 试试看:


   
   
$ awk '{print $2;}' colours.txt
color
red
yellow
red
purple
green
purple
brown
brown
yellow

在这种情况下,awk显示第二列,用$ 2表示。 这是相对直观的,因此您可能会猜出print $ 1显示第一列,而print $ 3显示第三列,依此类推。

要显示所有列,请使用$ 0

美元符号( $ )后的数字是一个表达式 ,因此$ 2$(1 + 1)表示同一件事。

有条件地选择列

您使用的示例文件非常结构化。 它有一行充当标题,而各列直接相互关联。 通过定义条件需求,您可以限定希望awk在查看此数据时返回的内容。 例如,要查看第2列中与“黄色”匹配的项目并打印第1列的内容:


   
   
awk '$2=="yellow"{print $1}' colours.txt
banana
pineapple

正则表达式也可以。 该条件查询条件为$ 2 ,以便与字母p大致匹配,后跟任意数量的(一个或多个)字符,然后依次跟着字母p


   
   
$ awk '$2 ~ /p.+p/ {print $0}' colours.txt
grape   purple   10
plum    purple   2

数字自然由awk解释。 例如,要打印第三列包含大于5的整数的任何行:


   
   
awk '$3>5 {print $1, $2}' colours.txt
name    color
banana  yellow
grape   purple
apple   green
potato  brown

场分隔符

默认情况下,awk使用空格作为字段分隔符。 但是,并非所有文本文件都使用空格来定义字段。 例如,使用以下内容创建一个名为colours.csv的文件:


   
   
name,color,amount
apple,red,4
banana,yellow,6
strawberry,red,3
grape,purple,10
apple,green,8
plum,purple,2
kiwi,brown,4
potato,brown,9
pineapple,yellow,5

只要您指定应将哪个字符用作命令中的字段分隔符,Awk即可以完全相同的方式处理数据。 使用--field-separator (或简称为-F )选项来定义定界符:


   
   
$ awk -F "," '$2=="yellow" {print $1}' file1.csv
banana
pineapple

保存输出

使用输出重定向,您可以将结果写入文件。 例如:

 $  awk -F, '$3>5 {print $1, $2} colours.csv > output.txt 

这将创建一个包含awk查询内容的文件。

每个查询 ,方法是在awk语句中包括重定向:
 $  awk '{print > $2".txt"}' colours.txt 

这将生成名为yellow.txtred.txt等的文件。

在下一篇文章中,您将了解有关字段,记录和一些强大的awk变量的更多信息。


本文改编自社区技术播客Hacker Public Radio

翻译自: https://opensource.com/article/19/10/intro-awk

awk 入门

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值