1.数据结构
Series
类似python的字典。
创建:
pandas.Series([1,2,3,4,5], index=['a','b','c','f','e']) #Index相当于字典的key
pandas.Series ( {'a':5} ) #用字典建立对象
查询对象中的元素
s[['a','b','c']] #直接查询一组key,返回用这组key和对应value组成的新Series对象
s['a'] #直接查询某个key,返回valu
head(n), tail(n) #取出头n行或尾n行的方法,默认n=5
index values #两个对象属性,可以取得key列表和values
元素统计方法
len(s) #Series长度,包括NaN
s.count() #Series长度,不包括NaN
s.unique() #返回不重复values值
s.value_counts() #value出现次数统计
DataFrame
创建
pandas.DataFrame([s,s,s]) #使用Series建立,每一行为一个series
df=pandas.DataFrame([s1,s2]) #使用列表的列表建立,每一行为一个列表anaaffsfsdfa
df=pandas.DataFrame({"a":s1,"b":s2}) #使用字典结合列表建立,每一列为一个列表,字典key作为新对象的列的标题
查看对象中的元素
df.columns #返回列名称列表
for index, row in df.iterrows(): #以行遍历整个数据,返回值为每行数据的数组
print row.values
head(n), tail(n) #取出头n行或尾n行的方法,默认n=5
元素统计方法
df.shape #返回数据行数和列数组成的元素