要遍历 DataFrame 的每列,可以使用 for
循环和 df.columns
属性。
示例代码如下:
import pandas as pd
# 假设我们有一个名为 df 的 DataFrame
# 遍历 df 的每列
for column in df.columns:
# 在此处处理每列的数据
# 例如,打印列的名称和列的所有值
print(column)
print(df[column])
在上面的代码中,df.columns
包含 DataFrame 中的所有列名,for
循环将迭代每个列名,并将每列名存储在变量 column
中。然后,使用 df[column]
可以访问 DataFrame 中名为 column
的列。
注意:如果需要遍历 DataFrame 的行,可以使用 for
循环和 df.iterrows()
方法。示例代码如下:
# 遍历 df 的每行
for index, row in df.iterrows():
# 在此处处理每行的数据
# 例如,打印行的索引和行的所有值
print(index)
print(row)
在上面的代码中,df.iterrows()
返回一个生成器,生成器中的每个元素都是一个元组,其中第一个元素是行的索引,第二个元素是行的内容。for
循环将迭代每个元组,并将索引存储在变量 index
中,将行的内容存储在变量 row
中。