本博文仅仅汇总博主需要的内容,因为博主十分懒惰,所以博文内容肯定不全。
参考链接:grouby使用方法
groupby分组
tt = data.groupby('bodyType')
for i,j in tt:
print(i,j)
分组+聚合
聚合之后,返回一个DataFrame。
使用方法1:
agg(列表)
列表中每一个元素都是一个函数,该函数会作用于groupby之后的每个列。
tt = data.groupby('bodyType').agg([np.mean,min])
tt
使用方法2:
agg(字典)
字典的key是每一个列的名称,字典的value是名称(列)所做的聚合操作。
tt = data.groupby('bodyType').agg({'brand':[min],'city':[np.mean]})
tt
分组+apply
返回一个series
tt = data.groupby('bodyType').apply(lambda x:x['brand'].mean() - x['city'].mean())
tt