awk切割日志笔记

//nginx 日志格式
1x.2.1xx.1xx - - [20/Sep/2017:00:00:01 +0800] xxxx-xxxx-xxxx-xxxx "GET /xxxx/xxxx/getFields?param=xxxxxxxxxxxxxx HTTP/1.1" 200 212 0.007 "-" "Apache-HttpClient/4.3.1 (java 1.5)” “xx.xxx.xxx.xxx, 1x.x.1xx.2xx" 0.007 HTTP/1.1 77 xxxxxxxx015e9ade1d750a0xxxxxxxxxx


// 查看nginx日志调指定接口的调用方
cat access.log | grep "20/Sep/2017:08:0" | grep "/xx/xxxx/getFields" | awk '{split(substr($17,2), a, ","); print a[1]}' |  sort | uniq -c | sort -nr

// 查看log日志指定时间的接口调用情况
cat item.log.2017092008 |grep "2017-09-20 08:0" | awk -F 'url' '{split(substr($2,2), a, "?");print a[1]}' | sort | uniq -c | sort -nr | grep -v "wduss"

// 查看nginx每分钟的调用量
cat  access.log | grep "20/Sep/2017:08:3" | awk '{print $4}' | awk -F: '{ a[$2":"($3-$3%2)]++ } END{ for(i in a){ split(i,t,":");print i, t[1]":"t[2]+2, a[i] | "sort -k3rn"} }'

// 查看nginx每分钟的接口调用量
cat  access.log | grep "20/Sep/2017:08:2" | awk '{split($4, a, ":"); split($8, b, "?"); c[b[1],a[2]":"(a[3]-a[3]%1)]++ } END{ for(i in c){split(i, idx, SUBSEP); print idx[0],idx[1],idx[2], c[idx[1],idx[2]] | "sort -k3rn"}}'
eg:
/xx/xxxxx/getFields 08:30--08:31 465
/xx/xxxxx/getItemSkuWithAttrList 08:39--08:40 198
/xx/xxxx/getItemSkuWithAttrList 08:32--08:33 186
/xx/xxxx/getFields 08:31--08:32 184

/ /每cycle分钟,获取前top 
cat  access.log | grep "20/Sep/2017:08:" | awk 'BEGIN{cycle=10; top=10} {split($4, a, ":"); split($8, b, "?"); c[b[1],a[2]":"(a[3]-a[3]%cycle)]++ } END{ for(i in c){split(i, idx, SUBSEP); split(idx[2], time, ":"); print idx[1],idx[2]"--"time[1]":"time[2]+cycle, c[idx[1],idx[2]] | "sort -k3rn | head -n" top}}' 
eg:
/xx/xxxx/getFields 08:40--08:50 5822
/xx/xxxx/getFields 08:0--08:10 5698
/xx/xxxx/getFields 08:20--08:30 5638
/xx/xxxx/getItemSkuWithAttrList 08:50--08:60 1884
/xx/xxxx/getItemSkuWithAttrList 08:40--08:50 1693


/// 使用到的函数简介
一、split 初始化和类型强制 
       awk的内建函数split允许你把一个字符串分隔为单词并存储在数组中。你可以自己定义域分隔符或者使用现在FS(域分隔符)的值。
格式如下:
   split (string, array, field separator)
   split (string, array)   -->如果第三个参数没有提供,awk就默认使用当前FS值。
例子:
例1:替换分隔符

1
2
3
time= "14:31:56"
out=`echo  $time  | awk  '{split($0,a,":");print a[1],a[2],a[3]}' `
echo  $out

 

 二、substr 截取字符串

        返回从起始位置起,指定长度之子字符串;若未指定长度,则返回从起始位置到字符串末尾的子字符串。
格式如下:
  substr(s,p) 返回字符串s中从p开始的后缀部分
  substr(s,p,n) 返回字符串s中从p开始长度为n的后缀部分
例子:

1
2
[root @test  ~] # echo "12345678" | awk '{print substr($0,1,3)}'
123



三、length 字符串长度
   length函数返回没有参数的字符串的长度。length函数返回整个记录中的字符数。

1
2
[root @test  ~] # echo "123456" | awk '{print length}'
6

四、gsub 函数

gsub函数则使得在所有正则表达式被匹配的时候都发生替换。gsub(regular expression, subsitution string, target string);简称 gsub(r,s,t)。

举例:把一个文件里面所有包含 abc 的行里面的 abc 替换成 def,然后输出第一列和第三列

1
awk  '$0 ~ /abc/ {gsub("abc", "def", $0); print $1, $3}'  abc.txt


  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: AWK 是一种强大的文本处理工具,它提供了切割字符串的功能。你可以使用内置的函数 substr() 和 split() 对字符串进行切割。你也可以使用正则表达式来提取你需要的部分。 例如,下面是使用 substr() 函数切割字符串的例子: ``` awk '{print substr($0, 1, 5)}' inputfile ``` 这段代码会输出输入文件中每一行的前 5 个字符。 更多关于 AWK 切割字符串的细节,请参考 AWK 的文档或者相关书籍。 ### 回答2: Shell是一种脚本语言,在Linux和类Unix操作系统上非常流行。通过使用Shell脚本,可以轻松地执行各种任务和自动化工作。其中,Shell命令awk是一款非常强大的工具,可以用来切割字符串,进行文本处理,并对文本进行格式化输出。 awk是一种基于行的文本处理工具,最主要的功能是文本分割和格式化输出。其中,使用awk进行字符串的切割是其非常重要和常用的功能。在Shell中,可以通过使用awk命令进行字符串的切割,同时也可以对切割出的字符串进行格式化输出。 具体来看,awk命令可以用以下格式进行使用: awk 'BEGIN {表达式} {action} END {表达式}' file 在这个命令中,BEGIN和END是可选的,它们用来设计在awk开始处理数据前和结束处理数据后执行的动作。其中,表达式可以是任何有效的awk表达式,而action则是对每行数据进行处理的动作。 当使用awk进行字符串切割时,需要使用内置的分隔符FS(Field Separator),默认情况下FS是空格或Tab键。通过设置FS,可以让awk定位到需要操作的字段,然后将其切割出来。此外,还可以使用$符号来定位到每个字段,其中$0代表整行数据,$1代表第一个字段,$2代表第二个字段,以此类推。 例如,如果需要将以下数据对每个字段进行切割,并输出第二个和第三个字段,则可以使用以下awk命令: cat file.txt | awk -F "\t" '{print $2,$3}' 在这个命令中,-F "\t"指定分隔符为Tab键,而{print $2,$3}则是输出第二个和第三个字段。通过这样的方式,可以快速、方便地对字符串进行切割和处理。 总而言之,awk命令是Shell中非常重要和实用的工具,可以用来进行字符串的切割、文本处理和格式化输出等任务。通过灵活地使用awk命令和其内置的分隔符,可以轻松地完成各种文本处理任务,提高工作效率和准确性。 ### 回答3: Shell和awk都是常用的文本处理工具,在处理文本中的字符串时,常常需要对字符串进行切割、格式化等操作。本文将简单介绍如何使用Shell和awk切割字符串。 一、Shell中的字符串切割 在Shell中,字符串可以看作是一种特殊的变量类型。可以通过变量名来访问字符串中的每一个字符,如下所示: str="hello,world" echo "第二个字符是:${str:1:1}" 上述代码中,使用冒号分隔符来对字符串进行切割,第一个数字表示从字符串的第几个字符开始切割,第二个数字表示切割的长度。 另外,在Shell中也可以通过sed、cut等命令来对字符串进行切割。如下所示: str="hello,world" echo $str | cut -d "," -f 1 上述代码使用了cut命令,将字符串以逗号作为分隔符进行切割,然后输出第一部分。 二、awk中的字符串切割 awk是一种强大的文本处理工具,可以对文本进行高效的处理。在awk中,可以通过$符号访问每个输入的字段,可以结合正则表达式来进行字符串的切割和匹配。 以下是一个简单的例子: echo "hello,world" | awk -F, '{print $1}' 上述代码中,使用了-F选项来指定逗号为分隔符,然后输出第一个字段。 awk还支持sub和gsub函数,可以用来替换字符串中的特定字符。如下所示: echo "hello,world" | awk '{gsub(/o/,"O",$1);print $1}' 上述代码将$1字段中的所有o字符替换成O,然后输出修改后的内容。 总结: Shell和awk是文本处理的常用工具,字符串切割是文本处理中常用的操作之一。本文介绍了在Shell和awk中如何对字符串进行切割和处理,希望对读者有所帮助。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值