pandas——按行遍历dataframe的优选方法（itertuples，iterrows）

最新推荐文章于 2024-07-18 23:54:03 发布

ALittleHigh

最新推荐文章于 2024-07-18 23:54:03 发布

阅读量1.7k

点赞数 2

分类专栏： pandas 文章标签： pandas python 数据挖掘算法

本文链接：https://blog.csdn.net/whitedrogen/article/details/132488154

版权

pandas 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

本文介绍了Pandas库中两种遍历DataFrame行的方法：itertuples通过命名元组和可选参数控制索引和名称，而iterrows则返回(index,Series)对。itertuples通常更高效且能保持dtypes，但需注意避免修改迭代内容。

摘要由CSDN通过智能技术生成

1. 以命名元组的形式遍历DataFrame行

pandas.DataFrame.itertuples

DataFrame.itertuples(index=True, name='Pandas')

关键字参数：index

默认为True，所需为布尔值。当值为True时，将索引作为元组的第一个元素返回。

关键字参数：name

默认为“Pandas”，所需为字符串或None。命名返回的元组的名称，当为None时，返回普通元组。

返回：iterator

迭代器：用于返回DataFrame每行形成的命名元组，命名元组的第一个字段可能是索引，其余字段是列值。

tips：当列名是无效的Python标识符、或重复值、或以下划线开头时，该列名会以当前位置重命名。

示例：简单使用itertuples，不设置index和name

>>> df = pd.DataFrame({'num_legs': [4, 2], 'num_wings': [0, 2]},
...                   index=['dog', 'hawk'])
>>> df
      num_legs  num_wings
dog          4          0
hawk         2          2
>>> for row in df.itertuples():
...     print(row)
...
Pandas(Index='dog', num_legs=4, num_wings=0)
Pandas(Index='hawk', num_legs=2, num_wings=2)

示例：设置index=False以取消索引为首个字段

>>> for row in df.itertuples(index=False):
...     print(row)
...
Pandas(num_legs=4, num_wings=0)
Pandas(num_legs=2, num_wings=2)

示例：自定义元组名称

>>> for row in df.itertuples(name='Animal'):
...     print(row)
...
Animal(Index='dog', num_legs=4, num_wings=0)
Animal(Index='hawk', num_legs=2, num_wings=2)

2. 以 (index, Series) 对的形式遍历 DataFrame行

pandas.DataFrame.iterrows

返回：index

标签或标签元组。即行索引或多维索引元组。

返回：Series

以Series形式展示该行的数据。

示例：直接使用iterrows

由于 iterrows 会为每一行返回一个 Series，因此不会跨行保留 dtypes（DataFrames 的 dtypes 会跨列保留）。

>>> df = pd.DataFrame([[1, 1.5]], columns=['int', 'float'])
>>> row = next(df.iterrows())[1]
>>> row
int      1.0
float    1.5
Name: 0, dtype: float64
>>> print(row['int'].dtype)
float64
>>> print(df['int'].dtype)
int64