Python3 DataFrame数据排序与排名

最新推荐文章于 2024-07-29 18:45:30 发布

古月书斋

最新推荐文章于 2024-07-29 18:45:30 发布

阅读量6.2k

点赞数 3

分类专栏： Python 文章标签： python 开发语言

本文链接：https://blog.csdn.net/hudashi/article/details/124714679

版权

本文介绍了Python数据分析库pandas中DataFrame的数据排序和排名方法，包括sort_index()、sort_values()和rank()函数的使用，详细阐述了各参数的作用，如axis、ascending和method等，帮助理解如何对行、列进行升序或降序操作，并处理相等值的排名问题。

摘要由CSDN通过智能技术生成

pandas的DataFrame极大地简化了数据分析过程中一些烦琐操作，它是一个表格型的数据结构, 每一列代表一个变量，而每一行则是一条记录。简答地说，DataFrame是共享同一个index 的Series的集合。DataFrame数据的排序分为三类：1、对索引排序sort_index()；2、对值进行排序sort_values()；3、是对值进行排名rank()。

（1）、索引排名
对于索引排序，涉及到对行的索引和对列的索引进行升序或者降序排序函数df.sort_index(axis= , ascending= , inplace=)，需要特别注意这三个参数。axis表示对行的索引排序，还是对列的索引进行排序；ascending表示升序，还是降序操作。


dates = ['2022-01-01','2022-09-02','2022-01-03','2022-01-04','2022-01-05','2022-01-06']
dates=pd.to_datetime(dates)
df = pd.DataFrame(np.random.randn(6,4),index=dates,columns=list('ABCD'))

#默认按照行的索引进行升序排序
df.sort_index()
Out[48]: 
                   A         B         C         D
2022-01-01  0.096360  0.390240 -1.272864 -0.248937
2022-01-0