awk数组

本文通过awk实例讲解如何分析web日志,提取客户端地址及其访问次数,并按访问次数从大到小进行排序。主要涉及数组、for循环和排序命令的应用。
摘要由CSDN通过智能技术生成
数组是一个可以存储多个值的变量
定义数组:
  数组名[下标]=元素值
  调用:数组名[下标]
  a=[1,2“abc”]
  a[2]=abc   //下标从0开始

  遍历数组的用法:for(变量 in 数组名){print 数组名[变量]}

  -定义一个数组并调用
  # awk ‘BEGIN{a[0]=11;a[1]=88;print a[1],a[0]}’
  88  11
  # awk ‘BEGIN{a++;print a}’
  1
  # awk ‘BEGIN{a0++;print a0}’
  1
  # awk ‘BEGIN{a[0]++;print a[0]}'
  1

  -遍历数组并输出下标和对应的值
  # awk ‘BEGIN{a[0]=00;a[1]=11;a[2];for(i in a){print i,a[i]}’
  0  00
  1  11
  2  22
  -下标还可以为字符串,字符串记得加上双引号
  # awk ‘BEGIN{a[“dachui”]=0;print a[“dacui”]}’
  0

awk实例:
1.分析web日志中访问量的排名,要求输出客户端的地址、访问次数,按照访问次数从大到小输出
思路:
1.找到那个文件时记录web访问日志?
2.再去分析每一行中那些列是你要的数据
3.涉及到统计,合理使用数组和for循环
4.排序用那个命令?用什么选项可以从打到小?

# cat /var/log/httpd/access_log
183.136.255.56 - - [20/Mar/2020:14:34:35 +0800] “GET / HTTP/1.1” 403 4897 “_”“Mozilla/5.0
(Macintosh; Intenl Mac Os X 10.11; rv:47.0) Gecko/20100101 Firefox/47.0”
183.136.255.56 - - [20/Mar/2020:14:34:35 +0800] “GET / HTTP/1.1” 403 4897 “_”“Mozilla/5.0
(Macintosh; Intenl Mac Os X 10.11; rv:47.0) Gecko/20100101 Firefox/47.0”
183.136.255.56 - - [20/Mar/2020:14:34:35 +0800] “GET / HTTP/1.1” 403 4897 “_”“Mozilla/5.0
(Macintosh; Intenl Mac Os X 10.11; rv:47.0) Gecko/20100101 Firefox/47.0”



只要匹配到重复的值,就让增加1
下标应该是ID地址,增加1
ip[$1]++   print ip[$1]
# awk ‘{ip[$1]++} END{for (i in ip){print i,ip[i]}}’ /var/log/httpd/acce
sort  -rn  -k  2

文本去重
a.txt
a  b  c
a  b  c
c  b  d
a  a  a 
//只会显示重复记录的一条
$0 整行文本

# awk ‘a[$0]++’ a.txt
a  b  c
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值