查看ip.txt文件中的内容
[root@hadoop4 test]# cat ip.txt
www.baidu.com 192.168.2.1
www.taobao.com 192.168.2.2
www.sina.com 192.168.2.3
www.taobao.com 192.168.2.1
www.taobao.com 192.168.2.3
www.baidu.com 192.168.2.1
统计所有网址的访问量,降序
[root@hadoop4 test]# awk '{print $1}' ip.txt | sort | uniq -c | sort -n -r -k 1
3 www.taobao.com
2 www.baidu.com
1 www.sina.com
统计访问所有网址的独立用户数
[root@hadoop4 test]# awk '{print $2}' ip.txt | sort | uniq | wc -l
3
统计用户ip的访问所有网址的次数,降序
[root@hadoop4 test]# awk '{print $2}' ip.txt | sort | uniq -c | sort -n -r -k 1
3 192.168.2.1
2 192.168.2.3
1 192.168.2.2
备注1:sort -k 1 -n -r 表示按第一列 数值大小 降序
备注2:uniq 命令之前要先 sort 完才能正确去重,否则无法正确去重