id
sim
0 a 1
1 b 2
2 c 3
3 d 2
4 a 1
5 d 2
0 a 1
1 b 2
2 c 3
3 d 2
4 a 1
5 d 2
6 d 3
以上是一个数据表xx ,id --客户id, sim--绑定的设备编码,求绑定不同数量设备的客户数量分布
python:xx.drop_duplicates().groupby('id').count().reset_index().groupby('sim').count().reset_index()
sql:select t.sim ,count(*)from(select t.id ,count(dictinct(t.sim)sim from xx t groupby t.id)t group by t.sim)
仅做笔记