1. 说明
DataFrame是Pandas库中处理表的数据结构,可看作是python中的类似数据库的操作,是Python数据挖掘中最常用的工具。下面介绍DataFrame的一些常用方法。
2. 遍历
1) 代码
import pandas as pd
import math
df=pd.DataFrame({'key':['a','b','c'],'data1':[1,2,3],'data2':[4,5,6]})
print(df)
for idx,item in df.iterrows():
print(idx)
print(item)
2) 结果
data1 data2 key
0 1 4 a
1 2 5 b
2 3 6 c
0
data1 1
data2 4
key a
Name: 0, dtype: object
… 略
3. 同时遍历两个数据表
1) 代码
import pandas as pd
import math
df1=pd.DataFrame({'key':['a','b'],'data1':[1,2]})
df2=pd.DataFrame({'key':['c','d'],'data2':[4,5]})
for (idx1,item1),(idx2,item2) in zip(df1.iterrows(),df2.iterrows()):
print("idx1",idx1)
print(item1)
print("idx2",idx2)
print(item2)
2) 结果
('idx1', 0)
data1 1
key a
Name: 0, dtype: object
('idx2', 0)
data2 4
key c
Name: 0, dtype: object
('idx1', 1)
data1 2
key b
Name: 1, dtype: object
('idx2', 1)