awk数组里面的$0问题及想到的（baidu上面看到的）

最新推荐文章于 2023-09-15 15:24:11 发布

weixin_34310369

最新推荐文章于 2023-09-15 15:24:11 发布

阅读量155

点赞数

文章标签： awk

原文链接：http://blog.51cto.com/lzt417/911248

版权

觉得这个文章不错，就先记下来了！

原文地址：http://zhidao.baidu.com/question/379044580.html

1、awk是按行处理文本数据的、

2、awk中的术语将一行为一个记录；一个记录还可以根据分隔符为多个字段、

3、$0标示整行内容（一个记录）

a[$0]++ 用于分别统计不相同的记录个数，即，相同的$0内容，个数累加。

例子：1.txt 的测试数据

111 abc def abc
222 ddd sss klm
333 efg xyz ddd
abc ddd sss klm

统计第二个字段域的名字和个数：？

awk '{ w[$2]+=1 }END {for (a in w) print a,w[a]}' 1.txt

[root@lzt-Exam script]# awk '{ w[$2]+=1 } END { for (a in w) print a,w[a]}' 1.txt
abc 1
efg 1
ddd 2

分析：

$2表示第二个字段，用w[abc]表示abc出现的次数，用w[ddd]表示ddd出现的次数，用w[efg]表示efg出现的次数。当$2=ddd的时候，累加w[ddd].这样，w就是一个包含所有$2的字段的集合，

最后通过for循环,把各自出现的次数打印出来！

附录以前碰到的题：顺便记录一下，便于翻看

有如下文件，请用awk命令计算出第二域含有bbb的个数
[root@lnmp ~]# cat a.txt
aaa     bbb     cccc    dddd
bbb     ccc     dddd    eeee
ccc     bbb     dddd    bbbb
eee     fff     zzzz    ssss
ggg     lll     bbbb    eeee
=======================================
测试数据：
[root@oldboy ~]# cat a.txt
aaa     bbb     cccc    dddd
bbb     ccc     dddd    eeee
ccc     bbb     dddd    bbbb
eee     fff     zzzz    ssss
ggg     lll     bbbb    eeee

王同学率先发出两个靠谱的答案：
1)
[root@oldboy ~]# awk '$2=="bbb" {i=i+1} END {print i}' a.txt
2

2)
[root@oldboy ~]# awk '{if($2=="bbb") i=i+1} END {print i}' a.txt
2

张同学也发出来俩答案：
3)
[root@oldboy ~]# awk '{if($2=="bbb") ++oldboy[$2]} END {for (a in oldboy) print oldboy[a]}' a.txt
2

4)
[root@oldboy ~]# awk '{if($2=="bbb") ++oldboy[$2]} END {for (a in oldboy) print a,oldboy[a]}' a.txt
bbb 2

5)
某个11期的郑同学正在上课，趁着上课间隙也加入了10期群里的答题挑战。
[root@oldboy ~]# awk '$2 == "bbb"' a.txt|wc -l
2

6）
[root@oldboy ~]# awk '{print $2}' a.txt |awk '/bbb/' |wc -l
2

7）
一个山东大汉（也是老男孩的学生，呵呵），意外的发言发言了，答案同样令人震惊。
[root@oldboy ~]# aa=(`cat a.txt |awk '{print $2}' |awk '/bbb/'`)
[root@oldboy ~]# echo ${#aa[@]}
2

8）
庞风同学也给了自己的答案。
[root@oldboy ~]# awk 'NF==4 && $2 ~ /bbb/ {print $2}' a.txt|sort|uniq -c
2 bbb

转载于:https://blog.51cto.com/lzt417/911248