1、假如,有一bb文档的格式如下:
111.1.1.1- - [23/Apr/2011:00:00:40 +0800] "GET aa.png HTTP/1.1" 304 - "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)"
现在要求提取以上红体字部分,我们可以通过以下命令实现:
grep aa.png bb|cut -d\" -f6
2、假如,有一bb文档的格式如下:
112.23.173.208 - - [23/Apr/2011:00:19:25 +0800] "GET aa.png HTTP/1.1" 304 - "http://*****.mail.163.com/js3/read/readhtml.jsp?ssid=SM6k5X8DBFSnJ30wqKARBTa6FgM7opYA6Yg0IdgUilc%3d&mid=51:1tbiMxQpVElyp7SuggAAse" "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1) ; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; TheWorld)"
现在,要获取红体字部分,可以用以下命令来实现:
grep aa.png bb|cut -d\" -f4|cut -sd/ -f3
3、以第2点为例,要求:统计出现aa.png且时间格式为“23/Apr/2011”次数。操作如下:
grep aa.png bb|sed 's,[^[]*\[,,;s,:.*,,'|uniq -c
首先在 bb文档中查找aa.png 然后,删除“日/月/年”之外字符,最后,统计出现的次数