pandas的DataFrame几种遍历方式对比
我自己从数据库读了一个dataframe,df_concept
- df.index
- df.iterrows()
比第一种方法快了一点,每次迭代可以直接获取每一行数据 - df.itertuples()
这种遍历方式明显快了很多
这三种遍历方式在代码量上差不多的,最后一种明显效率高啊 - apply()
如果迭代过程中的处理方法简单,通用apply的方式自定义匿名函数或者新函数效率更高,但是个人用着感觉apply的时候报错信息不太友好,很难通过报错信息定位到具体的代码行,如果处理逻辑复杂,在调试时还是不要了,或者逻辑处理好了,再用apply来跑数据更方便。