下班后我都学了什么 | Python 如何高效的遍历DataFrame?

小小数据分析师~ 给自己充充电🔋,然后把笔记整理在博客~~

❤️ 如果我的总结对你有帮助,请点赞👍支持哦,谢谢!!
欢迎留言交流~~ 一起进步 💦

❤️ 「更多文章」
下班后我都学了什么 | 文章集合


🌟 目录

一、为什么学这个?
二、内容大纲
三、正文
四、脑图


一、为什么学这个?

背景:上周打比赛,对百万量级的DataFrame做遍历,用的for循环处理要将近6hours ……,效率低下。

因此,除了for循环,用更好的方法优化吗?

请添加图片描述


二、内容大纲 👇

  • 0 参考资料
  • 1 查询DataFrame的方法?
    • 1.0 数据说明
    • 1.1 []切片方
    • 1.2 loc
    • 1.3 iloc
    • 1.4 at
    • 1.5 iat
    • 1.6 ix
  • 2 遍历DataFrame 的方法及比较
    • 2.0 数据说明
    • 2.1 用不同方法实现:两元素相加 # aaa + bbb
      (1)python 循環 + iloc 定位
      (2)python 循環 + iat 定位
      (3)pandas.DataFrame.iterrows() 迭代器
      (4)pandas.DataFrame.apply 迭代
      (5)pandas.DataFrame.apply 迭代 + 只讀兩列
      (6)列表構造
      (7)pandas 數組操作
      (8)numpy 數組操作
  • 3 结论
    • 3.1 运行速度
    • 3.2 建议
      (1)优先使用numpy数组操作;不能数组操作的时候用列表构造!
      (2)能用at/iat就不用loc/iloc;能用apply就不用迭代,能用数组操作就不用其他方法。

二、正文

请添加图片描述


三、脑图

请添加图片描述

  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值