sort_values排序
1、对单列的值排序
对销量进行排序
df.sort_values(by='销量')
# 倒序
df.sort_values(by='销量',ascending=False)
2、对多列的值进行排序
对部门和销量进行排名
df.sort_values(by=['部门','销量'])
rank排名
语法:rank(axis=0, method: str = 'average'
,ascending: True/False)
method | 说明 |
---|---|
average | 默认:在每个组中分配平均排名 |
min | 对整个组使用最小排名 |
max | 对整个组使用最大排名 |
first | 按照值在数据中出现的次序分配排名 |
dense | 类似于method=‘min’,但组件排名总是加1,而不是一个组中的相等元素的数量 |
国际排名
设置ascending=False参数进行倒序排序
# 国际排名
df['排名'] = df['销量'].rank(method='min',ascending=False)
# 取整
df['排名']=df['排名'].map(lambda x : round(x))
中国排名
df['排名'] = df['销量'].rank(method='dense',ascending=False)
df['排名']=df['排名'].map(lambda x : round(x))
按部门分组排名
df['排名'] = df.groupby("部门")['销量'].rank(method='dense')
df['排名']=df['排名'].map(lambda x : round(x))
df = df.sort_values(['部门','排名'])