import pandas as pd
import numpy as np
from pandas import Series,DataFrame
data = {'state':['Ohio','Ohio','Ohio','Nevada','Nevada'],
'year':[2000,2001,2002,2001,2002],
'pop':[1.5,1.7,3.6,2.4,2.9]}
frame = DataFrame(data)
frame #可以把字典,等长的列表转换成一个 dataframe dataframe有行索引也有列的索引
DataFrame(data,columns=['year','state','pop']) #指定列的顺序,DataFrame就会按照指定的顺序进行排列
frame2 = DataFrame(data,columns=['year','state','pop','debt'],
index=['one','two','three','four','five'])
frame2 # 如果列找不到就会返回一个NAN 这里同样的可以将1~N-1的索引改成指定索引
frame2.columns # 返回列的信息
frame2['state'] #通过字典标记方式可以将dataframe的列获取为一个Series
frame2.year # 同上
frame2['state'].name # 返回的Series的name属性也是设置好的
frame2['state'].index.name
frame2.ix['three'] # 行可以通过为止