请问使用awk如何先按照第一列的值分组，然后再统计之后的各列

最新推荐文章于 2024-07-10 14:42:06 发布

github_zwl

最新推荐文章于 2024-07-10 14:42:06 发布

阅读量3.4k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/github_34457546/article/details/78510030

版权

比如有个文件
a 123 234 345
a 234 345 567
a 123 345 789
b 123 234 567
先按第一列分开，在分别统计后3列，不重复数的个数。结果：前3行 a 2 2 3 后一行 b 1 1 1。
最后输出效果
a 2 2 3
b 1 1 1

思路

awk '{for(i=2;i<=NF;i++)if(!a[$1,$i,i]++){b[$1];c[$1,i]++;if(i==NF)sum[$1]+=$NF}} END{for(i in b){printf i;for(j=1;j<=NF-1;j++)printf " "c[i,j];print " "sum[i]" "sum[i]/c[i,NF]}}' i
a 2 2 1701 567
b 1 1 567 567

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。