1.Pandas 基本数据结构 series
series 就是给数组加了一个索引id,变成一个tuple(id,value)
比如 filename 这个series 中的值为 (19576, u’image/val2014_resized/COCO_val2014_000000116696.jpg’)
初始化series obj = Series([4, 7, -5, 3])
遍历名字为col的series
for i in col.iteritems():
print j[0] # j[0] j[1] 分别啥id和value
2.Pandas 基本数据结构 DataFrame
DataFrame 可以看做是series的字典,(里面存放 id series) 比如 data中的[(0,file_name),(1,image_id),(2,caption)]
初始化 DataFrame
caption_data = pd.DataFrame.from_dict(data) #这里data是 [{},{},{}]
遍历 DataFrame:
for c, col in annotations.iteritems(): #其中c是DataFrame中series的名称,col 是每个series的值
if c == 'file_name':
for j in col.iteritems(): # 遍历名字为file_name的series
print j