pandas的DataFrame极大地简化了数据分析过程中一些烦琐操作,它是一个表格型的数据结构, 每一列代表一个变量,而每一行则是一条记录。简答地说,DataFrame是共享同一个index 的Series的集合。DataFrame数据的排序分为三类:1、对索引排序sort_index();2、对值进行排序sort_values();3、是对值进行排名rank()。
(1)、索引排名
对于索引排序,涉及到对行的索引和对列的索引进行升序或者降序排序函数df.sort_index(axis= , ascending= , inplace=),需要特别注意这三个参数。axis表示对行的索引排序,还是对列的索引进行排序;ascending表示升序,还是降序操作。
dates = ['2022-01-01','2022-09-02','2022-01-03','2022-01-04','2022-01-05','2022-01-06']
dates=pd.to_datetime(dates)
df = pd.DataFrame(np.random.randn(6,4),index=dates,columns=list('ABCD'))
#默认按照行的索引进行升序排序
df.sort_index()
Out[48]:
A B C D
2022-01-01 0.096360 0.390240 -1.272864 -0.248937
2022-01-0