[Linux] shell中for循环grep正则统计指定关键字

需求是统计某个业务的访问个数日志服务器上的目录结构是如下,搜索最近7天的指定关键字数据,并排重统计个数:

drwxr-xr-x 2 root root 4096 Nov 15 08:00 2019-11-15
drwxr-xr-x 2 root root 4096 Nov 16 08:00 2019-11-16
drwxr-xr-x 2 root root 4096 Nov 17 08:00 2019-11-17
drwxr-xr-x 2 root root 4096 Nov 18 08:00 2019-11-18
drwxr-xr-x 2 root root 4096 Nov 19 08:00 2019-11-19
drwxr-xr-x 2 root root 4096 Nov 20 08:00 2019-11-20
drwxr-xr-x 2 root root 4096 Nov 21 08:00 2019-11-21
drwxr-xr-x 2 root root 4096 Nov 22 08:00 2019-11-22
[root@mail tmp]# ll /data1/mailLog/app/kafka/2019-11-22/
total 5708872
-rw-r--r-- 1 root root 4847545594 Nov 22  2019 api-mail-sina-com-cn.log

for循环的一行表示形式for ((i=15;i<=21;i++));do xxx;done
while循环的一行表示 while true;do xxx;done
获取当前年月`date +%Y-%m`
grep -oP只显示正则匹配到的内容
uniq|sort -u是去重

 for ((i=15;i<=21;i++));do cat `date +%Y-%m-$i`/api-mail-sina-com-cn.log|grep -oP "appid=2026078627&uid=\d+"|uniq|sort -u >/tmp/`date +%Y-%m-$i`.android.log;done

把匹配到的日志去重放入了/tmp/2019-11-22.android.log

wc -l *.android.log
   87851 2019-11-15.android.log
   78686 2019-11-16.android.log
   76190 2019-11-17.android.log
   90938 2019-11-18.android.log
   91705 2019-11-19.android.log
   91388 2019-11-20.android.log
   91796 2019-11-21.android.log

如果有不同的关键字,就多加几个grep,类似下面这个

 for ((i=15;i<=21;i++));do cat `date +%Y-%m-$i`/api-mail-sina-com-cn.log|grep "2026078627"|grep "active_client"|grep -oP "device_id=[^&]+|uniq|sort -u >/tmp/`date +%Y-%m-$i`.android.device.log;done

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值