动手学数据分析

组队学习的历程——>day03

构建一个都为数字的DataFrame数据

df2=pd.DataFrame(data=np.arange(16).reshape((4,4)),index=[1,2,3,4],columns=['d','a','b','c'])
df2

总结不同的排序方式:

1.让行索引升序排序

#代码
df3=df2.sort_index(axis=0)
df3

2.让列索引升序排序

#代码
df4=df2.sort_index(axis=1)
df4

3.让列索引降序排序

#代码
df5=df2.sort_index(axis=1,ascending=False)
df5

sort_index()默认按行索引升序排序,axis参数(axis=0默认按行,axis=1按列)可以改为按列索引升序排序。

ascending参数(ascending=True默认升序,ascending=False降序)可以改为按行索引降序排序。

by参数表示按哪行或列(axis参数决定)参数排序。

4.让任选两列数据同时降序排序

#代码
df6=df2.sort_values(by=['a','b'],ascending=False)
df6

总的来说是两种方法:sort_index()索引排序、sort_values()值排序,注意使用参数即可。

关于DataFrame的排序可以查看此网站,另外扩展了rank()排名问题:https://blog.csdn.net/weixin_41261833/article/details/104167592

对泰坦尼克号数据按票价和年龄两列进行综合排序(降序排列)从数据中发现票价和年龄与存活率的关系

#代码
# 读取前20条数据
df1.sort_values(by=['票价','年龄'],axis=0,ascending=False).head(20)
# 结论:票价高的前二十名中存活率是70%
df1.sort_values(by=['年龄','票价'],axis=
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值