Pandas的数据结构主要分为三种:Series(一维数组),DataFrame(二维的表格型)、Panel(三维数组)。
DataFrame又是其中最常用的pandas对象,类似excel表格,DataFrame基本属性:values,index,columns,dtypes,分别获取元素、索引、列名、类型。另外,size,ndim,shape等属性可以获取DataFrame的元素个数,维度数,数据形状。
(1)DataFrame按多列排序
import pandas as pd
data=pd.DataFrame({'group':['a','b','b','c','c'],'ouces':[4,3,12,3,4]})
data.sort_values(by=['group','ouces'],ascending=[False,True],inplace=True)
print(data)
上述代码先按照group降序排列,当group相同时再按照ouces升序排列,参数中的inplace=Ture直接将排序后的结果存在data,排序后的数据覆盖了原始数据。输出如下:
group ouces
3 c 3
4 c 4
1 b 3
2 b 12