使用awk对广告数据中bid、imp中的ip做运营商分类统计

经验:

1.    数据量较大的情况下使用shell脚本直接做数据的分类统计处理更方便

 

在对广告日志中的ip做了运营商识别后,还有最后一步就是需要分类统计这些运营商的分布信息,刚好最近粗浅地学习了shell awk,然后想要使用shell awk对文本进行统计分析(实际上是用exccel做countif电脑直接死翘翘)


文本文件字段长这样



列信息分别是bid_ip,bid_company, imp_ip, imp_company

目标是:统计bid_comapny,imp_company里面分别的分类统计

 

解决方法:

awk  ‘{s[$2] +=1} END {for(iin s){print i, s[i] }}’ ip_company.txt

awk  ‘{s[$4] +=1} END {for(iin s){print i, s[i] }}’ ip_company.txt


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值