- head -n 100 xxx.log 查看日志前100行
- head -n 100 xxx.log | grep "android"|grep "xxxx.zip" 管道搜索
- head -n 10000000 10.log | grep "android"|grep "xxxx.zip" | awk '{sum += $11};END{print sum}' 求$11列的和
- head -n 100 10.log | grep "CFNetwork" | awk -F \" '{print $2,$6}' | sort -nr ,
- 按数值降序排列,-n 按数值排序(避免10小于2的情况),-r 降序
- awk -F \" 按双引号来分割
- head -n 100 10.log | grep "CFNetwork" | awk -F \" '{print $2,$6}' | sort|uniq -c ,
- uniq -c在每列旁边显示该行重复出现的次数;
- uniq 去重
-
awk -F '"msg":' '{print substr($2,2,3)}' inner.txt | sort -nr | uniq 526 270 201 123
查某个数据的区间分布,可以借助python的histogram.py来处理
- cat 506.txt | awk '($2=="2"){print $4}' | histogram.py -B 0,500,800,1000,1500,2000,3000,5000 --percent 第二列等于2,打印第四列,区间分布统计
- cat 506.txt | awk '($2==2 && $4>2048){print $1,$4,$5}' | sort -n -r -k2 > android_506.txt 第二列等于2,第四列大于2048,打印第一,四,五列;按新的第二列(原第四列)数字降序排列,输出文件
- cat 10.log | awk '($15 ~/iOS/ && $7=="xxxx.zip"){print $7,$15}'
- tail -n 100000 10.log | awk '(($15 ~/iOS/) && $7=="xxxx.zip"){print $7,$15}' |wc -l
- tail -n 100 10.log | awk '($15 ~/iOS/){print $14}'
- tail -n 100000 10.log | awk '(($15 ~/iOS/) && $7=="xxxx.zip"){print $7,$15}' |wc -l
wc -l输出数量
histogram.py源码地址:https://github.com/bitly/data_hacks