Pandas库-笔记整理(1)-20201102
小目录:
- 对多变量的索引重置
- 生成对多变量的多统计表
- groupby()默认排序变量
- 使用groupby的分组聚合方法
- 按特定规则排序
正文:
- 对多变量的索引重置
对象.reset_index()
- 生成对多变量的多统计表
对象表名.groupby(['tag_1', 'Tag_2']).description.agg([调用函数_1, 调用函数_2])
-
groupby()默认用index来排序;sort_values(by=[‘变量名1’], [‘变量名2’])可以设置使用表中数据进行排序,默认优先用变量名1排序。
-
使用groupby按照某列(A)进行分组后,需要对另外一列(B)采用不同的聚合方法
对象.groupby('A')['B'].agg({'mean':np.mean, 'std': np.std})
- 把某个规则处理过的数据-升序排列
对象表名.对象列名,fillna('Unknown').values_counts().sort_values(ascending=False)