背景
近期有个统计脚本,原本每天早上8点统计当天账号被锁定的用户信息;后续发现逻辑需要优化为当天8点前24小时区间内,因此需要识别并过滤时间区间
遇到的问题
文件分布在两个不同日期为文件名的时间戳
cat或者grep可以直接对应2个不同文件
文本内容需要包含前一天8点后和当天8点前
由于文件使用“yyyy-mm-dd hh:mm:ss”格式时间戳开头,因此使用包含日期的时间戳直接精准识别,避免过滤干扰信息
grep -Pe "^$(date -d 'yesterday' '+%Y-%m-%d') (08|09|1[0-9]|2[0-3]):|^$(date '+%Y-%m-%d') 0[0-7]:"
由于用到时间变量和统计次数上限,因此优化脚本实现如下:
#!/bin/bash
# 设置今天和昨天的日期
today=$(date "+%Y-%m-%d")
yesterday=$(date -d "yesterday" "+%Y-%m-%d")
# 设置小于以下错误次数的忽略阈值
counts=10
# 执行并获取昨天8点到今天8点的命令结果
pass_err_res=$(cat /test/$today.log /test/$yesterday.log | grep "password error" |grep -Pe "^$(date -d 'yesterday' '+%Y-%m-%d') (08|09|1[0-9]|2[0-3]):|^$(date '+%Y-%m-%d') 0[0-7]:" | awk -F " " '{print "imap4 " $14}' | sort | uniq -c | sort -nr|awk '$1 >= $counts')
#后续结合执行的pass_err_res结果进行的发送动作不在此处赘述