Pandas数据特征分析
数据的排序
将一组数据通过摘要(有损地提取数据特征的过程)的方式,可以获得基本统计(含排序)、分布/累计统计、数据特征(相关性、周期性等)、数据挖掘(形成知识)。
.sort_index()方法在指定轴上根据索引进行排序,默认升序
.sort_index(axis=0, ascending=True)
In [1]: importpandas as pd
In [2]: importnumpy as np
In [3]: b = pd.DataFrame(np.arange(20).reshape(4,5), index=['c','a','d','b'])
In [4]: b
Out[4]:
0 1 2 3 4
c 0 1 2 3 4
a 5 6 7 8 9
d 10 11 12 13 14
b 15 16 17 18 19In [5]: b.sort_index()
Out[5]:
01 2 3 4a5 6 7 8 9b15 16 17 18 19c 01 2 3 4d10 11 12 13 14In [6]: b.sort_index(ascending=False)
Out[6]:
01 2 3 4d10 11 12 13 14c 01 2 3 4b15 16 17 18 19a5 6 7 8 9In [7]: c = b.sort_index(axis=1, ascending=False)
In [8]: c
Out[8]:4 3 2 10
c4 3 2 10
a9 8 7 6 5d14 13 12 11 10b19 18 17 16 15In [9]: c =c.sort_index()
In [10]: c
Out[10]:4 3 2 10
a9 8 7 6 5b19 18 17 16 15c4 3 2 10
d14 13 12 11 10
.sort_values()方法在指定轴上根据数值进行排序,默认升序
Series.sort_values(axis=0, ascending=True)
DataFrame.sort_values(by, axis=0, ascending=True) #by:axis轴上的某个索引或索引列表
In [11]: c = b.sort_values(2,ascending=False)
In [12]: c
Out[12]:
01 2 3 4b15 16 17 18 19d10