awk练习题一

awk常见选项

-F "分隔符"指明输入时用到的字段分隔符,默认的分隔符是若干个连续空白符

-v var=value 变量赋值

动作print

格式:

print item1,item2,...

说明:

逗号分隔符

输出item可以字符串,也可是数值;当前记录的字段、变量或awk的表达式

如省略item,相当于print $0

固定字符需要用 ""引起来,而变量和数字不需要

1、取出用UUID挂载的挂载点和磁盘文件系统

[root@y_zilong ~]# cat /etc/fstab 
/dev/mapper/cl-root     /                       xfs     defaults        0 0
UUID=b3690942-53e2-45a6-a459-3e23ab4d45f3 /boot                   ext4    defaults        1 2
/dev/mapper/cl-swap     swap                    swap    defaults        0 0
[root@y_zilong ~]# grep "^UUID" /etc/fstab 
UUID=b3690942-53e2-45a6-a459-3e23ab4d45f3 /boot                   ext4    defaults        1 2

[root@y_zilong ~]# grep "^UUID" /etc/fstab |awk '{print $2,$3}'
/boot ext4
[root@y_zilong ~]# 

2、取出网站访问量最大的前3个IP

[root@y_zilong ~]# cat /var/log/nginx/access.log 
10.0.0.1 - - [22/Apr/2021:04:44:02 -0400] "GET / HTTP/1.1" 200 4057 "-" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.129 Safari/537.36" "-"
10.0.0.1 - - [22/Apr/2021:04:44:02 -0400] "GET /nginx-logo.png HTTP/1.1" 200 368 "http://10.0.0.133/" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.129 Safari/537.36" "-"
10.0.0.1 - - [22/Apr/2021:04:44:02 -0400] "GET /poweredby.png HTTP/1.1" 200 4148 "http://10.0.0.133/" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.129 Safari/537.36" "-"
10.0.0.1 - - [22/Apr/2021:04:44:02 -0400] "GET /favicon.ico HTTP/1.1" 404 3971 "http://10.0.0.133/" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.129 Safari/537.36" "-"
10.0.0.1 - - [22/Apr/2021:04:44:13 -0400] "GET / HTTP/1.1" 304 0 "-" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.129 Safari/537.36" "-"

[root@y_zilong ~]# awk '{print $1}' /var/log/nginx/access.log 
10.0.0.1
10.0.0.1
10.0.0.1
10.0.0.1
10.0.0.1
[root@y_zilong ~]# awk '{print $1}' /var/log/nginx/access.log |sort|uniq -c|sort -nr|head -3
      5 10.0.0.1
[root@y_zilong ~]# 

3、取nginx的访问日志的中IP和时间

[root@y_zilong ~]# awk -F'[[ ]' '{print $1,$5}' /var/log/nginx/access.log |head -3
10.0.0.1 22/Apr/2021:04:44:02
10.0.0.1 22/Apr/2021:04:44:02
10.0.0.1 22/Apr/2021:04:44:02
[root@y_zilong ~]# 

4、取出分区利用率

[root@y_zilong ~]# df
Filesystem          1K-blocks    Used Available Use% Mounted on
devtmpfs               909016       0    909016   0% /dev
tmpfs                  924732       0    924732   0% /dev/shm
tmpfs                  924732    9888    914844   2% /run
tmpfs                  924732       0    924732   0% /sys/fs/cgroup
/dev/mapper/cl-root  17811456 4158052  13653404  24% /
/dev/sda1              999320  135708    794800  15% /boot
tmpfs                  184944      28    184916   1% /run/user/42
tmpfs                  184944    2344    182600   2% /run/user/0
/dev/sr0              6967726 6967726         0 100% /run/media/root/CentOS-8-BaseOS-x86_64

[root@y_zilong ~]# df |awk '{print $1,$5}'
Filesystem Use%
devtmpfs 0%
tmpfs 0%
tmpfs 2%
tmpfs 0%
/dev/mapper/cl-root 24%
/dev/sda1 15%
tmpfs 1%
tmpfs 2%
/dev/sr0 100%

[root@y_zilong ~]# df |awk -F"[[:space:]]+|%" '{print $1,$5}'
Filesystem Use
devtmpfs 0
tmpfs 0
tmpfs 2
tmpfs 0
/dev/mapper/cl-root 24
/dev/sda1 15
tmpfs 1
tmpfs 2
/dev/sr0 100

[root@y_zilong ~]# df |grep "^/dev/sd"|awk -F"[[:space:]]+|%" '{print $1,$5}'
/dev/sda1 15

[root@y_zilong ~]# df |awk -F"[[:space:]]+|%" '/^\/dev\/sd/{print $5}'
15

[root@y_zilong ~]# df |awk -F"[[:space:]]+|%" '/^\/dev\/sd/{print $1,$5}'
/dev/sda1 15

[root@y_zilong ~]# df |awk -F' +|%' '/^\/dev\/sd/{print $1,$5}'
/dev/sda1 15
[root@y_zilong ~]# 

5、取ifconfig输出结果中的IP地址

[root@y_zilong ~]# ifconfig ens33
ens33: flags=4163<UP,BROADCAST,RUNNING,MULTICAST>  mtu 1500
        inet 10.0.0.133  netmask 255.255.255.0  broadcast 10.0.0.255
        inet6 fe80::7109:ef7e:efd4:722e  prefixlen 64  scopeid 0x20<link>
        ether 00:0c:29:4d:87:05  txqueuelen 1000  (Ethernet)
        RX packets 35500  bytes 31847150 (30.3 MiB)
        RX errors 0  dropped 0  overruns 0  frame 0
        TX packets 15654  bytes 1444967 (1.3 MiB)
        TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0

[root@y_zilong ~]# ifconfig ens33|sed -n '2p'

        inet 10.0.0.133  netmask 255.255.255.0  broadcast 10.0.0.255
        
[root@y_zilong ~]# ifconfig ens33|sed -n '2p'|awk '{print $2}'
10.0.0.133
[root@y_zilong ~]# 

[root@y_zilong ~]# ifconfig ens33|awk '/netmask/{print $2}'
10.0.0.133
[root@y_zilong ~]# 

6、文件list.txt如下格式,请提取例如 ".baidu.com"前面的主机名部分并写入到回到该文件中

[root@y_zilong ~]# cat list.txt 
1 www.baidu.com
2 www.qq.com
3 study.study.com
4 python.python.com
5 yzl.yzl.com

[root@y_zilong ~]# awk -F"[ .]" '{print $2}' list.txt 
www
www
study
python
yzl

[root@y_zilong ~]# awk -F"[ .]" '{print $2}' list.txt >> list.txt 

[root@y_zilong ~]# cat list.txt 
1 www.baidu.com
2 www.qq.com
3 study.study.com
4 python.python.com
5 yzl.yzl.com
www
www
study
python
yzl
[root@y_zilong ~]# 

 

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: 1. 使用awk命令,将一个文件中的第一列和第二列相加,并输出结果。 2. 使用sed命令,将一个文件中的所有空行删除,并输出结果。 3. 使用grep命令,查找一个文件中包含特定字符串的行,并输出结果。 4. 使用awk命令,将一个文件中的所有行按照第二列进行排序,并输出结果。 5. 使用sed命令,将一个文件中的所有单词转换为大写,并输出结果。 6. 使用grep命令,查找一个文件中不包含特定字符串的行,并输出结果。 7. 使用awk命令,将一个文件中的所有行按照第一列进行分组,并输出结果。 8. 使用sed命令,将一个文件中的所有行反转,并输出结果。 9. 使用grep命令,查找一个文件中包含特定字符串的行数,并输出结果。 10. 使用awk命令,将一个文件中的所有行按照第三列进行筛选,并输出结果。 ### 回答2: awk、sed和grep是Linux系统中常见的文本处理工具,它们可以对文本进行搜索、替换、过滤、格式化等操作。以下是一些常见的练习题,可以帮助读者加深对这些工具的理解和掌握它们的使用技巧。 1. 使用awk命令统计日志文件中每个IP的访问次数。 awk '{a[$1]++} END {for(i in a) print i, a[i]}' logfile 其中,a[$1]++用于统计IP的访问次数,END子句用于在处理完整个文件后输出结果。 2. 使用sed命令批量重命名文件夹中所有的.jpg文件为.png。 sed -i 's/\.jpg/\.png/g' $(find /path/to/folder -type f -name '*.jpg') 其中,-i选项表示直接修改原文件,使用find命令来查找所有.jpg文件,并将其替换为.png。 3. 使用grep命令查找一个目录下所有包含“Linux”关键字的文件,并输出匹配结果。 grep -r "Linux" /path/to/directory 其中,-r选项表示递归查找所有文件,如果找到匹配项,则会输出所在的文件名和匹配的行。 4. 使用awk命令从一组数字中找出最大值和最小值,并计算它们的平均数。 echo "1 2 3 4 5" | awk 'BEGIN {max=0;min=999999} {for(i=1;i<=NF;i++) if($i>max) max=$i;else if($i<min) min=$i;total+=$i} END {print "Max:",max,"Min:",min,"Avg:",total/NF}' 其中,BEGIN子句用于初始化max和min变量,NF表示输入行的字段数量,END子句用于计算平均数。 以上是关于awk、sed和grep的基础练习题,掌握了这些基本操作后,读者可以尝试更复杂的文本处理任务,如去重、排序、计数等。同时,多查阅相关文档和资料,不断练习,可以更好地掌握这些工具。 ### 回答3: awk、sed、grep三者是Linux中常用的文本处理命令,它们都可以用来处理大量的文本信息。下面是一些实践练习。 1. 使用grep 给定一个文件file.txt,其中的每行都是一个字符串,找出其中包含字符串“hello”的所有行并输出到一个新的文件new.txt。 grep "hello" file.txt > new.txt 2. 使用awk 给定一个包含三列的文件file.txt(英语、数学和科学的成绩),找出其中科学成绩大于80分的所有学生。 awk '$3>80{print $0}' file.txt 3. 使用sed 给定一个文件file.txt,其中有若干行英文句子,将其中所有的小写字母转换为大写字母。 sed 's/[a-z]/\U&/g' file.txt 4. 使用grep和awk 给定一个包含多个文件的目录dir,找出其中含有文件名“error.log”的文件,并统计各个文件中“error”单词出现的总次数。 grep -l "error.log" dir/* | xargs awk '{count +=gsub(/error/,"&")}END{print count}' 以上是一些常用的练习题,可以帮助大家熟悉和掌握这些常用命令的使用方法。需要注意的是,在实践过程中,应该多加尝试,有问题及时查阅相关文档或寻求帮助。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

y_zilong

一分钱的肯定

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值