awk统计耗时记录小节[最大值，最小值，平均值，统计，占比，排序]

最新推荐文章于 2023-02-25 16:25:58 发布

frank59

最新推荐文章于 2023-02-25 16:25:58 发布

阅读量4.6k

点赞数

分类专栏： Linux 文章标签： AWK shell sort

本文链接：https://blog.csdn.net/frank59/article/details/9919937

版权

Linux 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

现在有一个filter统计的服务端业务逻辑的耗时统计日志，格式如下

第一列是关键字，第二列和第三列是其它参数，第四列是耗时，我只关心第四列。

目的是统计出服务端的耗时情况（耗时长短，以及所占比例），以便发现服务端是否有可以再逻辑上进行优化的空间。

首先是取出关心的数据：

由于这个日志并不完全是上图显示的格式，其中有不少的记录格式较为混乱，所以最先做的就是排除不规则的格式，选了个简单的方法：

awk '{if($2!="" && $3!="" && $4!=""){print $NF}}'  request_cost.log  | grep -E "^[0-9]+$" |

先排除2、3、4段没有值得记录，在取剩下记录的最后一个字段，取出的字段要保证是数字

这样出来的结果就是

接下来是统计以及算百分比：

 awk '{a[$1]++;s+=1}END{for (j in a) printf "%s %.2f%\n",j,a[j]*100/s}'

所以最终的指令是：

awk '{if($2!="" && $3!="" && $4!=""){print $NF}}' request_cost.log | grep -E "^[0-9]+$" | awk '{a[$1]++;s+=1}END{for (j in a) printf "%s %.2f%\n",j,a[j]*100/s}' > request_result.log

输出结果：

输出到文件后，再进行排序：

sort -k 2 -gr request_result.log  > sort_request_result.log

-k 2 是指以第二列的值为key， -gr 是按照数字反序排列

结果：

耗时0ms和1ms的就占了绝大部分，没啥优化空间了。

frank59

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录