遍历DataFrame两种方法,itertuples和列表推导式

毛毛蹭蹭

已于 2022-08-22 16:09:04 修改

阅读量481

点赞数

文章标签： pandas python 数据分析

于 2022-08-22 16:08:37 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36998298/article/details/126467982

版权

不建议用行序号方法( df.iloc和df.loc),是最慢的方法
向量化比逐行更快
多进程/多线程/协程可能更快,pandas并不能吃满cpu,大量耗时时再考虑优化问题

import time
from pandas import DataFrame
# f是函数
# 方法1
for row in df.itertuples(index=False):
    result += f(row.B, row.C)
# 上下两个原理相同
for(_, col1, col2, col3, col4) in df.itertuples(name=None):
    result += f(col2, col3)

# 方法2 列表推导式
# 单列直接取
result = [f(x) for x in df['col']]
# 两列用zip合并
result = [f(x, y) for x, y in zip(df['col1'], df['col2'])]
# 多列需要转numpy, ...是省略号
result = [f(row[0], ..., row[n]) for row in df[['col1', ...,'coln']].to_numpy()]
# 多列有特殊类型不能用numpy,还用zip
result = [f(row[0], ..., row[n]) for row in zip(df['col1'], ..., df['coln'])]

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
遍历DataFrame两种方法,itertuples和列表推导式

两种DataFrame逐行处理的方法
复制链接

扫一扫

毛毛蹭蹭 CSDN认证博客专家 CSDN认证企业博客

码龄7年

14: 原创

104万+: 周排名

8万+: 总排名

9013: 访问

: 等级

189: 积分

11: 粉丝

19: 获赞

0: 评论

22: 收藏

私信

关注

分类专栏

机考题解记录
vue初学记录 3篇

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。