from pandas import Series,DataFrame
import pandas as pd
Pandas中的数据结构
1 Series
一种类似于一维数组的对象,由一组数据(numpy中的各种数据类型)和一组对应的数据标签(索引)组成
data1=series([1,2,3,5])
data2=series([1,3,5,7],index=['a','b','c','d'])
data1.values
data1.index
numpy数组的运算都会保留值与索引间的链接
由于series是索引到值的一个映射,所以也可以看作是定长的有序字典
series最重要的一个功能是:在算术运算中自动对齐不同索引的值
series的表头:
data1.name
data1.index.name
表头和索引都可以通过赋值来更改
2 DataFrame
类似于表格的数据类型,含有一组有序的列,每一列的数据类型可以不同
既有行索引,又有列索引,可以看做series组成的字典
创建:
先创建一个字典,再导入dataframe
data={'data1':[d1,d2,d3],
'data2':[d4,d5,d6]}
data1=DataFrame(data)
取出某行:frame.loc['row_name']
取出某列:frame['column_name']
删除某列:del frame['column_name']
表格转置:frame.T
index对象不可修改
重索引,并插值
frame.reindex(['index1','index2'],fill_value=0)#对行
frame.reindex(columns=['index1','index2'])#对列
*插值只能对行