dataframe 排序_数据处理,Excel的排序功能,使用pandas在Python中轻松完成

e187e7e6-8ab1-44c4-bb81-31919cd597fc

转发本文并私信我"python",即可获得Python资料以及各种心得(持续更新的)

经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas

前言

排序是非常基本的数据操作,Excel 中的排序功能是非常灵活,可以对行列进行排序。本文看看 pandas 中是如何做到与 Excel 一样的灵活。


Excel 排序

Excel 中对数据进行排序是非常简单的。如下:

f7bf34f99b1b4b8c997471c1b7403541
  • 功能卡"数据","排序"按钮,即出现排序设置弹窗
  • 我们可以设置排序依据字段
  • 先设置按 班级 升序,班级 相同则按 语文 成绩升序
  • 在弹窗右上方,有"设置"按钮,其中可以选择对行还是对列排序

pandas 排序

pandas 中排序也是非常简单,并且基本与 Excel 上的流程原理是一致的,毕竟都是数据工具。如下:

c032f96be9cc4589a65522c87f2b1155
  • DataFrame.sort_values(),即可对其排序
  • 第一参数指定排序依据关键列
  • 第二参数指定对应第一参数的关键列采用的升降序
  • 同样可以设置 axis=1 ,按行排序(实际应用场景较少)

Excel 中的排序可以自定义序列,也就是让用户自定义顺序,pandas 中,这功能不是放在 sort_values 中实现。

实际上 Excel 中同样是把自定义序列放在独立的功能中

比如,希望 班级按照"5,4,2,1,3,6,7"排序,如下:

ce61b3edfe844c169941624c602c4bae
  • pandas 中需要先构造一列 Categorical ,作为辅助列
  • Categorical 实例化时的第二个参数指定顺序
  • 最后同样调用 sort_values 方法即可完成自定义排序

pandas 中的自定义排序相对繁琐,但我们完全可以自己对常用操作进行封装,同样可以做到一句到位完成自定义排序


总结

  • DataFrame.sort_values() ,对数据进行排序
  • 第一参数指定排序依据关键列
  • 第二参数指定升降序
  • 当需要自定义排序规则是,需要构造 Categorical 辅助列

下一节,将看看 Excel 的分列功能,以及 Excel 的官方数据处理插件 Power Query 的一些功能与 pandas 中的实现

如果希望从零开始学习 pandas ,那么可以看看我的 pandas 专栏。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值