Linux课上的作业周三交,若有考虑不周到的地方,还请多多指教。
需要处理的文本:文本下载地址 // 是网站的weblog信息
需求:
1.统计404的请求数
2.统计2014年4月份的访问量
3.统计共有多少个不同的IP访问
4、统计访问次数最多的前10个IP
wx@wx-desktop:/tmp/test$ awk '/404/{i++} END{print i}' access.log
wx@wx-desktop:/tmp/test$ awk '/Apr\/2014/{i++} END{print i}' access.log
wx@wx-desktop:/tmp/test$ awk '/^[0-9]*\./{data[$1]++} END{for(i in data ){print i}}' access.log | wc -l
wx@wx-desktop:/tmp/test$ awk '/^[0-9][0-9]*\./{data[$1]++} END{for(i in data ){print data[i],i}}' access.log | sort -k1 -n -r | head -10
//data数组下标为IP地址,数组内有多少元素,则有多少IP。下标对应的数组的值为IP访问的次数。