Linux三剑客之awk的使用进阶

最新推荐文章于 2024-07-15 15:20:27 发布

perye

最新推荐文章于 2024-07-15 15:20:27 发布

阅读量186

点赞数

分类专栏：工具 Linux 文章标签： shell linux awk

本文链接：https://blog.csdn.net/qq_19861715/article/details/113936027

版权

文章目录

前言
一、awk介绍
- 1.awk概述
- 2.awk能干啥?
二、awk使用方式
三、 awk内部相关变量
- 1、常用内置变量举例
- 2、内置变量分隔符举例
四、 awk工作原理
五、awk使用进阶
六、awk统计案例

前言

熟悉awk的命令行模式基本语法结构
熟悉awk的相关内部变量
熟悉awk常用的打印函数print
能够在awk中匹配正则表达式打印相关的行

一、awk介绍

1.awk概述

awk是一种编程语言，主要用于在linux/unix下对文本和数据进行处理，是linux/unix下的一个工具。数据可以来自标准输入、一个或多个文件，或其它命令的输出。
awk的处理文本和数据的方式：逐行扫描文件，默认从第一行到最后一行，寻找匹配的特定模式的行，并在这些行上进行你想要的操作。
awk分别代表其作者姓氏的第一个字母。因为它的作者是三个人，分别是Alfred Aho、Brian Kernighan、Peter Weinberger。
gawk是awk的GNU版本，它提供了Bell实验室和GNU的一些扩展。
下面介绍的awk是以GNU的gawk为例的，在linux系统中已把awk链接到gawk，所以下面全部以awk进行介绍。

2.awk能干啥?

awk用来处理文件和数据的，是类unix下的一个工具，也是一种编程语言
可以用来统计数据，比如网站的访问量，访问的IP量等等
支持条件判断，支持for和while循环

二、awk使用方式

1.命令行模式使用

（一）语法结构

awk 选项 '命令部分' 文件名

特别说明：
引用shell变量需用双引号引起

（二）常用选项介绍

-F 定义字段分割符号，默认的分隔符是空格
-v 定义变量并赋值

（三）命令部分说明

正则表达式，地址定位

'/root/{awk语句}'        sed中：'/root/p'
'NR==1,NR==5{awk语句}'      sed中：'1,5p'
'/^root/,/^ftp/{awk语句}'    sed中：'/^root/,/^ftp/p'

{awk语句1;awk语句2;…}

'{print $0;print $1}'    sed中：'p'
'NR==5{print $0}'        sed中：'5p'
注：awk命令语句间用分号间隔

BEGIN…END…

'BEGIN{awk语句};{处理中};END{awk语句}'
'BEGIN{awk语句};{处理中}'
'{处理中};END{awk语句}'

2. 脚本模式使用

（一）脚本编写

#!/bin/awk -f 定义魔法字符
以下是awk引号里的命令清单，不要用引号保护命令，多个命令用分号间隔
BEGIN{
   FS=":"}
NR==1,NR==3{
   print $1"\t"$NF}
...

（二）脚本执行

方法1：
awk 选项 -f awk的脚本文件 要处理的文本文件
awk -f awk.sh filename

sed -f sed.sh -i filename

方法2：
./awk的脚本文件(或者绝对路径) 要处理的文本文件
./awk.sh filename

./sed.sh filename

三、 awk内部相关变量

变量	变量说明	备注
$0	当前处理行的所有记录
$1,$2,$3…$n	文件中每行以间隔符号分割的不同字段	awk -F: ‘{print $1,$3}’
NF	当前记录的字段数（列数）	awk -F: ‘{print NF}’
$NF	最后一列	$(NF-1)表示倒数第二列
FNR/NR	行号
FS	定义间隔符	‘BEGIN{FS=":"};{print $1,$3}’
OFS	定义输出字段分隔符，默认空格	‘BEGIN{OFS="\t"};print $1,$3}’
RS	输入记录分割符，默认换行	‘BEGIN{RS="\t"};{print $0}’
ORS	输出记录分割符，默认换行	‘BEGIN{ORS="\n\n"};{print $1,$3}’
FILENAME	当前输入的文件名

1、常用内置变量举例

# head /etc/passwd > 1.txt
# awk -F: '{print $1,$(NF-1)}' 1.txt
# awk -F: '{print $1,$(NF-1),$NF,NF}' 1.txt
# awk '/root/{print $0}' 1.txt
# awk '/root/' 1.txt
# awk -F: '/root/{print $1,$NF}' 1.txt
root /bin/bash
# awk -F: '/root/{print $0}' 1.txt
root:x:0:0:root:/root:/bin/bash
# awk 'NR==1,NR==5' 1.txt
# awk 'NR==1,NR==5{print $0}' 1.txt
# awk 'NR==1,NR==5;/^root/{print $0}' 1.txt
root:x:0:0:root:/root:/bin/bash
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

2、内置变量分隔符举例

FS和OFS:
# awk 'BEGIN{FS=":"};/^root/,/^lp/{print $1,$NF}' 1.txt
# awk -F: 'BEGIN{OFS="\t\t"};/^root/,/^lp/{print $1,$NF}' 1.txt
root /bin/bash
bin /sbin/nologin
daemon /sbin/nologin
adm /sbin/nologin
lp /sbin/nologin
# awk -F: 'BEGIN{OFS="@@@"};/^root/,/^lp/{print $1,$NF}' 1.txt
root@@@/bin/bash
bin@@@/sbin/nologin
daemon@@@/sbin/nologin
adm@@@/sbin/nologin
lp@@@/sbin/nologin
[root@server shell]#

RS和ORS：
修改源文件前2行增加制表符和内容：
vim 1.txt
root:x:0:0:root:/root:/bin/bash hello world
bin:x:1:1:bin:/bin:/sbin/nologin        test1 test2

# awk 'BEGIN{RS="\t"};{print $0}' 1.txt
# awk 'BEGIN{ORS="\t"};{print $0}' 1.txt

四、 awk工作原理

awk -F: '{print $1,$3,$4}' /etc/passwd
awk工作原理

awk使用一行作为输入，并将这一行赋给内部变量$0，每一行也可称为一个记录，以换行符(RS)结束
每行被间隔符:(默认为空格或制表符)分解成字段(或域)，每个字段存储在已编号的变量中，从$1开始
问：awk如何知道用空格来分隔字段的呢？
答：因为有一个内部变量FS来确定字段分隔符。初始时，FS赋为空格
awk使用print函数打印字段，打印出来的字段会以空格分隔，因为$1,$3之间有一个逗号。逗号比较特殊，它映射为另一个内部变量，称为输出字段分隔符OFS，OFS默认为空格
awk处理完一行后，将从文件中获取另一行，并将其存储在$0中，覆盖原来的内容，然后将新的字符串分隔成字段并进行处理。该过程将持续到所有行处理完毕

五、awk使用进阶

1. 格式化输出print和printf

最低0.47元/天解锁文章

perye

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Linux三剑客之awk的使用进阶

文章目录前言一、awk介绍1.awk概述2.awk能干啥?二、awk使用方式1.命令行模式使用（一）语法结构（二）常用选项介绍（三）命令部分说明2. 脚本模式使用（一）脚本编写（二）脚本执行三、 awk内部相关变量1、常用内置变量举例2、内置变量分隔符举例四、 awk工作原理五、awk使用进阶1. 格式化输出print和printf2. awk变量定义3. awk中BEGIN...END使用（一）举例说明1（二）举例说明24. awk和正则的综合运用（一）举例说明练习5. awk的脚本编程（一
复制链接

扫一扫