Pandas数据分析基础：排序、基本统计、累计统计、相关分析

最新推荐文章于 2024-06-29 16:12:49 发布

a1183976042

最新推荐文章于 2024-06-29 16:12:49 发布

阅读量390

点赞数

分类专栏： # Python

本文链接：https://blog.csdn.net/a1183976042/article/details/105087354

版权

Python 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

一、数据的排序

（一）基本概念：

一组数据表达一个或多个含义，通过摘要（有损的地提取数据特征的过程），得到：基本统计（含有排序）、分布/累计统计、数据特征（相关性、周期性）、数据挖掘（形成知识）

（二）排序

（1）操作索引的排序

.sort_index()：在指定轴上根据索引进行排序，默认零轴（纵向）升序，，参数axis指定轴，ascending指定升序或降序。

import pandas as pd
import numpy as np
b = pd.DataFrame(np.arange(20).reshape(4,5), index=['b', 'a', 'c','d'])
print(b)print(b.sort_index())    #默认
print(b.sort_index(axis=1,ascending=False)  #一轴（横向排序），降序

（2）操作数据的排序

.sort_values()：在指定轴上根据数值进行排序，默认升序。
Series.sort_values()：参数axis指定轴，ascending指定升序或降序。
DataFrame.sort_values()：参数by指定axis上某个索引或索引列表，axis指定轴，ascending指定升序或降序。
*含有NaN的，无论升序降序，永远排在排序的末尾

import pandas as pd
import numpy as np
b = pd.DataFrame(np.arange(20).reshape(4,5), index=['c', 'a', 'd','b'])
print(b.sort_values(2, ascending=False))
print(b.sort_values('a', axis=1,ascending=False))
a = pd.DataFrame(np.arange(12).reshape(3,4), index=['a', 'd','b'])
print((a+b).sort_values(2, ascending=False))