awk 数组

19 篇文章 0 订阅
    数组是一个可以存储多个值的变量 
    定义数组
            数组名[下标]=元素值
            调用:数组名[下标]
            a=[1,2,"abc"]
            a[2]=abc        //下标从0开始

            遍历数组的用法:for(变量 in shuzum){print 数组名[变量]}

            -定义一个数组并调用
            # awk 'BEGINa[0]=11;a[1]=88 a[1],a[0]'
            88 11
            # awk 'BEGIN{a++;print a}'
            1
            # awk  'BEGIN{a0++;print a}'
            1
            # awk  'BEGIN{a[0]++;print [a]}'
            1

            -遍历数组并输出下标和对应的值
            # awk 'BEGIN{a[0]=00;a[1]=11;a[2]=22; for (i in a){print i,a[i]}}'
            0 00
            1 11
            2 22
            -下标还可以为字符串,字符串记得加上双引号
            # awk 'BEGIN{a["dachui"]=0; print a["dachui"]}'
            0

awk 实例:
1分析web日志中访问量的排名,要求输出客户端的地址、访问次数,按照访问次数从大到小输出
思路:
1.找到那个文件是记录web访问日志的
2.再去分析每一行那些列是你要的数据
3.涉及到统计,合理使用数组和for循环
4.排序用哪个命令?用什么选项可以从大到小?

    var/log/httpd/access_log

    只要匹配道重复的值,就让值+1
    ip[$i]++ print ip [$1]
    # awk '{ip[$1]++ END(for ()i in ip){print i , ip{i]}}' 
    var/log/httpd/access_log
    sort -rn -k 2

    文本去重:
    a.txt
    a  b  c
    a  b  c
    c  b  d
    a  a  a

    $0  整行文本
    //只显示重复记录的一条
    # awk 'a[$0]++' a.txt
    a  b  c
    
    文本整行去重:
    # awk '!a[$0]++' a.txt
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值