在Pandas中,如果我们想要逐行访问DataFrame的数据,需要对其进行遍历。这里总结了3种遍历DataFrame行的方法,并推荐其中最简洁高效的方式。
首先,我们创建一个示例DataFrame:
python
col1 col2 col3
0 1 4 7
1 2 5 8
2 3 6 9
方法一:.iterrows()
这是推荐的方式,可以这样遍历:
python
for index, row in df.iterrows():
print(index, row['col1'], row['col2'], row['col3'])
输出:
0 1 4 7
1 2 5 8
2 3 6 9
.iterrows()返回的row是一个Series,代表每一行的数据。
方法二:按行号遍历
python
for i in range(len(df)):
print(df.iloc[i])
输出:
col1 1
col2 4
col3 7
col1 2
col2 5
col3 8
col1 3
col2 6
col3 9
方法三:.loc遍历行索引
python
for row_label in df.index:
print(df.loc[row_label])
综上,遍历DataFrame行的方法有.iterrows()、按行号遍历和.loc等。但.iterrows()方法无疑是最简洁高效的方式。它返回行的Series,方便我们访问每列的值。