注:log.txt内容为
07.46.199.184 [28/Sep/2010:04:08:20] "GET /robots.txt HTTP/1.1" 200 0 "msnbot"
123.125.71.19 [28/Sep/2010:04:20:11] "GET / HTTP/1.1" 304 - "Baiduspider"
123.125.71.19 [28/Sep/2010:04:20:11] "GET / HTTP/1.1" 304 - "Baiduspider"
1. awk '{print $0}' ---print $0:输出所有输入
awk 可以从stdin读取并输入到stdout。
cat test.txt | awk '{print $0}'
这个语句的作用是读取test.txt,并且输出。
$0:表示一整行
注:这里需要注意的是awk后面有个空格
2.echo "who am i?" | awk '{print $2}'
Awk还会根据输入行中的空白字符(空格,tab)自动将行切分为字段,并自动处理连着的分隔字符,你可以通过$1,$2,$3等来引用分割后的字段。
注(下面是AWK的发明人原话):
AWK是一门处理文本文件的语言。它把文件看作一串记录(record),缺省情况下一行即为一个记录。每一行又被拆成若干域(field)。我们可以把一行中的第一个词看作第一域,第二个词看作第二域,以此类推。一个AWK程序就是一连串“模式——动作”语句。AWK一次读入一行,然后对照程序中的各个模式进行扫描。一旦匹配成功就执行相应的操作(action)。
3.awk '{print $1}' log.txt ---print $1:输出第一个field
4.echo 'who am i? 123 456' | awk '{print $NF}' ---print $NF:输出最后一个field
可以对NF进行加减操作,表示反向上n个段:
echo 'who am i? 123 456' | awk '{print $(NF-1)}'
5.awk '{print NR ")" $1 "->" $(NF-2)}' log.txt ---print $NR:输出当前正在处理的行号
其中使用“)”:来表示一个字符")"。可以使用逗号来分隔print的多个参数,它们会被转化为空格
awk '{ print NR, $1, $(NF-2)}' log.txt
6.awk '{ print $2}' log.txt | awk 'BEGIN{FS=":"}{ print $1 }'
BEGIN{FS=":"}:表示指定分隔符为“:”
awk '{print $2}' logs.txt | awk 'BEGIN{FS=":"}{print $1}' | sed 's/\[//'
7.awk '{if($(NF-2) == "200") {print $0}}' log.txt
使用if语句
8.awk '{a+=$(NF-2); print "Total so far:", a}' logs.txt
awk '{a+=$(NF-2)}END{print "Total:", a}' logs.txt
第二条语句,来表示,到END的时候,调用后面的语句