awk,gawk基本用法笔记221107

AWK是一种编程语言。AWK 有几种实现方式(主要以解释器的形式)。AWK已被编入POSIX中。今天使用的主要实现是:

  • nawk(“ new awk”,oawk原始UNIX实现的演变),已在* BSD上使用,并在Linux上广泛使用;
  • mawk,主要是坚持标准功能的快速实现;
  • gawk,GNU实现,具有许多扩展;
  • 在 Busybox的(小,适用于嵌入式系统,功能也不多)。

如果您只关心标准功能,请致电awk,它可以是gawk或nawk或mawk或其他实现。如果要使用GNU awk中的功能,请使用gawk或Perl或Python。

我的理解是: awk是将文本逐行筛选, 再将筛选行按(用-F指定的)分割符拆分成多列, 进行处理

基本格式
awk [选项] # 可以没有
'单引号开始
BEGIN{ BEGIN语句块代码 }
/表达式/{表达式语句块代码} 
/表达式2/{表达式语句块代码} 
/表达式n/{表达式语句块代码} 
END{END语句块代码}
单引号结束'
文件1,文件2...文件n # 如果有表达式块,就要有输入, 输入可以用重定向或文件 , 文件不能写在单引号内

只用BEGIN{}语句块的话,可以不要输入流, 否则都要有输入流

几种简单用法

例1 : 查看包含"root"字符串的行

sudo awk /root/{print} /etc/passwd

👆效果如同👇

sudo grep root /etc/passwd

👆效果如同👇

sudo awk '/root/{print $0}' /etc/passwd

例2

awk 'BEGIN{print "hello world"}'

如果语句块中有空格,就要用引号包住

例3

echo hello | awk {print}

例4

echo -e "world\n你" | awk '
	BEGIN { print "hello " }
	/wo/{print}
	/你/{print}
	END { print "好" } 
'

例5

awk '
	BEGIN{print "hello"} BEGIN{print "world"}
	BEGIN{print "世界"} BEGIN{print "你好"}
'

例6 : print 等效 print $0

sudo awk /root/{print} /etc/passwd
sudo awk '/root/{print $0}' /etc/passwd



选项

POSIX options: GNU long options: (standard)
-f progfile --file=progfile
-F fs --field-separator=fs
-v var=val --assign=var=val
Short options: GNU long options: (extensions)
-b --characters-as-bytes
-c --traditional
-C --copyright
-d[file] --dump-variables[=file]
-D[file] --debug[=file]
-e ‘program-text’ --source=‘program-text’
-E file --exec=file
-g --gen-pot
-h --help
-i includefile --include=includefile
-l library --load=library
-L[fatal|invalid|no-ext] --lint[=fatal|invalid|no-ext]
-M --bignum
-N --use-lc-numeric
-n --non-decimal-data
-o[file] --pretty-print[=file]
-O --optimize
-p[file] --profile[=file]
-P --posix
-r --re-interval
-s --no-optimize
-S --sandbox
-t --lint-old
-V --version

4个好记的常用选项: 大F , 小f , 大V , 小v
  • -F 指定分隔符, 不指定的话, 默认是 空格 和 tab(\t)
  • -f 指定文件, 可以省略, 文件路径全名写在最后即可
  • -v 指定awk自己的变量
  • -V 查看版本



awk , nawk , mawk , gawk

awk 是一种编程语言,用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件,或其它命令的输出(即管道)。它支持用户自定义函数和 动态正则表达式等先进功能,是linux/unix下的一个强大编程工具。它在命令行中使用,但更多是作为脚本来使用。

awk的处理文本和数据的方式是这 样的,它逐行扫描文件,从第一行到最后一行,寻找匹配的特定模式的行,并在这些行上进行你想要的操作。如果没有指定处理动作,则把匹配的行显示到标准输出 (屏幕),即默认处理动作是print;如果没有指定模式,则所有被操作所指定的行都被处理,即默认指定模式是全部。awk分别代表其作者姓氏的第一个字母。因为它的作者是三个人,分别是Alfred Aho、Brian Kernighan、Peter Weinberger。gawk是awk的GNU版本,它提供了Bell实验室和GNU的一些扩展。

像shell一样,awk也有好几种,常见的如awk、nawk、mawk、gawk,其中

awk:最初在1 9 7 7年完成,1 9 8 5年发表了一个新版本的awk,它的功能比旧版本增强了不少,awk 能够用很短的程序对文档里的资料做修改、比较、提取、打印等处理,如果使用C 或P a s c a l 等语言编写程序完成上述的任务会十分不方便而且很花费时间,所写的程序也会很大;

nawk: 在 20 世纪 80 年代中期,对 awk语言进行了更新,并不同程度地使用一种称为 nawk(new awk) 的增强版本对其进行了替换。许多系统中仍然存在着旧的awk 解释器,但通常将其安装为 oawk (old awk) 命令,而 nawk 解释器则安装为主要的 awk 命令,也可以使用 nawk 命令。Dr. Kernighan 仍然在对 nawk 进行维护,与 gawk 一样,它也是开放源代码的,并且可以免费获得;

mawk:mawk 是 awk 编程语言的解释器。awk语言在多媒体数据文件以及文本的检索和处理,算法的原型设计和试验都有广泛的使用。mawk带给awk新的概念,它实现了在《The AWK Programming Language》(Aho, Kernighan and Weinberger, The AWK Programming Language, Addison-Wesley Publishing, 1988.被认为是 AWK 手册。)中定义的 awk语言。mawk遵循 POSIX 1003.2 (草案 11.3)定义的 AWK 语言,包含了一些没有在AWK 手册中提到的特色,同时 mawk 提供一小部分扩展,另外据说mawk是实现最快的awk;

gawk: 是 GNU Project 的awk解释器的开放源代码实现。尽管早期的 GAWK 发行版是旧的 AWK 的替代程序,但不断地对其进行了更新,以包含 NAWK 的特性;

目前,大家都比较倾向于使用awk和gawk,

  • Ubuntu系统中的各种awk的选项设置,可以通过sudo update-alternatives --config awk来完成,实际上你通过手动修改软链接也能实现。
  • Debian最小化安装的时候awk的链接是指向mawk的。



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

kfepiza

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值