组队学习的历程——>day03
构建一个都为数字的DataFrame数据
df2=pd.DataFrame(data=np.arange(16).reshape((4,4)),index=[1,2,3,4],columns=['d','a','b','c'])
df2
总结不同的排序方式:
1.让行索引升序排序
#代码
df3=df2.sort_index(axis=0)
df3
2.让列索引升序排序
#代码
df4=df2.sort_index(axis=1)
df4
3.让列索引降序排序
#代码
df5=df2.sort_index(axis=1,ascending=False)
df5
sort_index()默认按行索引升序排序,axis参数(axis=0默认按行,axis=1按列)可以改为按列索引升序排序。
ascending参数(ascending=True默认升序,ascending=False降序)可以改为按行索引降序排序。
by参数表示按哪行或列(axis参数决定)参数排序。
4.让任选两列数据同时降序排序
#代码
df6=df2.sort_values(by=['a','b'],ascending=False)
df6
总的来说是两种方法:sort_index()索引排序、sort_values()值排序,注意使用参数即可。
关于DataFrame的排序可以查看此网站,另外扩展了rank()排名问题:https://blog.csdn.net/weixin_41261833/article/details/104167592
对泰坦尼克号数据按票价和年龄两列进行综合排序(降序排列)从数据中发现票价和年龄与存活率的关系
#代码
# 读取前20条数据
df1.sort_values(by=['票价','年龄'],axis=0,ascending=False).head(20)
# 结论:票价高的前二十名中存活率是70%
df1.sort_values(by=['年龄','票价'],axis=