Daniel 说得很清楚了,不过关于Python的说法有点小问题--别用循环。
#抛砖引玉的代码
import pandas as pd
data = [['city','name','num' ] ,
['广州','a','1001' ] ,
['广州','a','1001' ] ,
['广州','b','1002' ] ,
['深圳','c','1003' ] ,
['深圳','d','1004' ] ,
['深圳','e','1005' ] ,]
#上面是我们的数据
df = pd.DataFrame(data[1:],columns = data[0])
print(df)
#去重
df.drop_duplicates()
grouped=df['num'].groupby(df['city'])
#方法1 groupby实现
print(grouped.count())
#方法2 透视表
print(df.pivot_table(values=['num'],index = ['city'],aggfunc= 'count'))
代码粗暴,大概是这样