遍历DataFrame行（附各种方法性能对比）

最新推荐文章于 2025-04-07 21:15:10 发布

北.海

最新推荐文章于 2025-04-07 21:15:10 发布

阅读量1.1w

点赞数 3

分类专栏： python 文章标签：遍历DataFrame行

本文链接：https://blog.csdn.net/Norsaa/article/details/88981328

版权

本文探讨了在Python数据分析中遍历DataFrame行的几种方法，包括iterrows()、iloc()、apply()和自定义函数，通过对30000行数据的操作，比较了它们的执行效率。结果显示，apply()和自定义函数的执行速度显著快于for循环和iloc()，对于大规模数据处理，推荐使用高效的方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在利用python进行数据分析和处理时，经常会需要遍历DataFrame行，不同的遍历方法会对数据处理的效率有很大的影响。

现在有以下的数据

import pandas as pd
from pandas import DataFrame as DF

from datetime import datetime
data=DF({'data1':np.random.randn(30000),'data2':np.random.randn(30000),'data3':np.random.randn(30000)})

import pandas as pd
from pandas import DataFrame as DF
from datetime import datetime
data=DF({'data1':np.random.randn(30000),'data2':np.random.randn(30000),'data3':np.random.randn(30000)})

通过不同的遍历方法原数据的各个元素*2，并赋值给新的DF数据

方法1）DF.iterrows()

frame=DF()
a=datetime.now()
for index, row in data.iterrows():
    frame=frame.append(row*2)
print('start time',a)
print('end time',datetime.now())

结果：start time 2019-04-02 20:51:58.385586
end time 2019-04-02 20:52:36.782586 总用时38s左右

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

北.海

关注关注

3
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

Pandas DataFrame遍历的性能优化：加速技巧与最佳实践

RcxhClass的博客

10-06

709

Pandas提供了许多向量化操作，这些操作可以在底层使用高度优化的C代码执行，从而显著提高性能。相比于使用循环遍历DataFrame的每一行或每一列，使用向量化操作能够以更高效的方式进行元素级的计算。例如，可以使用Pandas的矢量化字符串方法来处理DataFrame中的文本数据，而不是使用循环逐个处理每个元素。、向量化的条件表达式和并行处理等技巧，可以显著提高Pandas DataFrame遍历的性能。在处理大型数据集时，合理选择适当的方法和技巧，可以有效减少代码的执行时间，提高数据处理的效率。

python pandas 加速循环_Pandas DataFrame遍历加速/性能优化

weixin_39653622的博客

12-08

1249

如果您使用Python和Pandas进行数据分析，即使对于小型DataFame，使用标准Python循环也是很费时间的，而对于大型DataFrame则需要花费特别长的时间。有什么方法可以优化呢？西面来看看不同遍历方法的性能标准循环DataFrame(数据帧)是具有行和列的Pandas对象(objects)。如果使用循环，则将遍历整个对象。 Python无法利用任何内置函数，而且速度非常慢。在我们的...

参与评论您还未登录，请先登录后发表或查看评论

dataframe遍历效率对比

ningyanggege的博客

04-13

2870

python

DataFrame的遍历、排序、去重与分组

热门推荐

judyqing的博客

11-29

3万+

import pandas as pd dict=[[1,2,3,4,5,6],[0,0,0,0,0,0]] data=pd.DataFrame(dict) print(data) for indexs in data.index: print(data.loc[indexs].values[0:-1]) ( 按行遍历数据) import pandas as pd dict=[...

如何优雅的遍历dataframe

weixin_38363801的博客

03-25

752

最佳解决方案要以 Pandas 的方式迭代遍历DataFrame的行，可以使用： DataFrame.iterrows() for index, row in df.iterrows(): print row["c1"], row["c2"] DataFrame.itertuples() for row in df.itertuples(index=True, name='Pandas'): print getattr(row, "c1"), getattr(row, "c2")

在pandas中遍历DataFrame行的实现方法

09-18

本文将详细介绍四种不同的方法来遍历DataFrame的行，并解释每种方法的工作原理和适用场景。首先，我们创建了一个简单的DataFrame，如下所示： ```python import pandas as pd inp = [{'c1':10, 'c2':100}, {'c1'...

dataframe类型数据的遍历_pandas中遍历dataframe的每一个元素

weixin_39798943的博客

12-23

3517

假如有一个需求场景需要遍历一个csv或excel中的每一个元素，判断这个元素是否含有某个关键字那么可以用python的pandas库来实现。方法一：pandas的dataframe有一个很好用的函数applymap，它可以把某个函数应用到dataframe的每一个元素上，而且比常规的for循环去遍历每个元素要快很多。如下是相关代码：import pandas as pddata = [["str"...

1.dataFrame的几种遍历方式

liuwei423210896的专栏

11-11

3582

from recall import config from sklearn.model_selection import train_test_split # 1.dataframe的遍历 import pandas as pd import os # 设置pandas的全部列数 pd.set_option('display.max_columns', None) data_path='....

如何遍历一个dataframe中的每一行

weixin_35752645的博客

01-10

8241

你可以使用 for 循环来遍历 dataframe 中的每一行。在每次循环中，你可以使用 iterrows() 方法来获取 dataframe 的每一行。示例代码如下： forindex, row in df.iterrows(): print(index, row) 在这段代码中，index 是每一行的索引，row 是一个包含每一列数据的 Series 对象。你可以使用 row['co...

pandas中遍历dataframe的每一个元素的实现

09-18

主要介绍了pandas中遍历dataframe的每一个元素的实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

遍历dataframe每一行的每一个元素

zhuxian2009的专栏

09-18

9677

python遍历的代码，其中df是dataframe类型： #1. 从mysql读取数据 #"ts_code", "buydate", "buyprice", "selldate", "sellprice", "duration", "strategyid" df = self.dbadapter.QueryBTStrategy(id=1) ...

python dataframe遍历效率_对Python中DataFrame按照行遍历的方法_python

weixin_28630185的博客

12-29

795

下面就为大家分享一篇对Python中DataFrame按照行遍历的方法，具有很好的参考价值，希望对大家有所帮助。一起过来看看吧在做分类模型时候，需要在DataFrame中按照行获取数据以便于进行训练和测试。import pandas as pddict=[[1,2,3,4,5,6],[2,3,4,5,6,7],[3,4,5,6,7,8],[4,5,6,7,8,9],[5,6,7,8,9,10]]d...

加速遍历数据的方法

卑微人的博客

05-29

306

加速遍历数据的方法 #1.原始遍历dataframe #最慢的 # for i in range(nrows): # row_data = data.iloc[i,:] # airport_code = row_data['机场编码'] # city = row_data['城市名称'] # airport_city_dicts[airport_code] = city # # # [1,2,34] # # print(data) # 矩 # 2、加速

【Python】 Pandas 遍历DataFrame的正确姿势速度提升一万倍

小白兔的窝

09-26

4717

原文：https://zhuanlan.zhihu.com/p/97269320 最近做科研时经常需要遍历整个DataFrame，进行各种列操作，例如把某列的值全部转成pd.Timestamp格式或者将某两列的值进行element-wise运算之类的。大数据的数据量随便都是百万条起跳，如果只用for循环慢慢撸，不仅浪费时间也没效率。在一番Google和摸索后我找到了遍历DataFrame的至少8种方式，其中最快的和最慢的可以相差12000倍！本文以相加和相乘两种操作为例，测试8种方法的运行速度，并附上示范

DataFrame循环处理效率的记录

Mark_Australia的博客

02-17

1597

pandas

dataframe for循环_Numpy向量化优化dataframe数据处理效率

weixin_39582724的博客

11-20

354

在进行业界大规模数据处理及特征工程的时候，往往需要对dataframe进行处理。而处理方式一般人会选择用apply的方式。apply方式进行了一些底层的优化，相比直接对dataframe进行for循环效率高了很多。但是使用了apply后，依然有很多优化的空间。方法如下：Pandas循环提速7万多倍！Python数据分析攻略文中提到了一种用numpy进行优化的方法，但是当你真正执行的时候你会发现其具...

for循环+zip根据列名遍历dataframe元素

weixin_44709340的博客

07-12

1606

for循环和zip()函数配合使用实现根据列名遍历dataframe的元素。

pd.DataFrame追加行

04-01

此外，还可以用loc方法，但loc通常用于已知索引的情况，添加行可能需要先创建一个新行，可能比较麻烦。举个例子，如果原DataFrame是df，要添加一行数据，可以先创建一个字典，然后转换为DataFrame，再用concat。...