一、Series类型
Series类型由一组数据及与之相关的数据索引组成。
创建:
1、列表
a = pd.Series([5,4,3],index=['a','b','c'])
2、字典
b = pd.Series({'a':5,'b':4,'c':3}, index=['c','a','b','d'])
#按index顺序输出,d的值为NaN
3、从ndarray类型创建
in:
import pandas as pd
import numpy as np
c = pd.Series(np.arange(3),index=np.arange(9,6,-1))
print(c)
out:
9 0
8 1
7 2
dtype: int32
Series类型操作方法:
a.index #获得索引
a.value #获得数据
索引方法与ndarray类型一致
in操作:'c' in a #会显示True或False
Series类型在运算中会自动对齐不同索引的数据
二、DataFrame类型
DataFrame是一个表格型的数据类型,既有行索引、也有列索引,常用于表达二维数据,是二维带“标签”数组。
DataFrame创建
1、从二维ndarray对象创建
import pandas as pd
import numpy as np
d = pd.DataFrame(np.arange(8).reshape(2,4))
2、从一维ndarray对象字典创建
dt = {'one':pd.Series([4,3,2], index=['a','b','c']),
'two':pd.Series([9,8,7], index=['a','c','d'])}
e = pd.DataFrame(dt)
#数据根据行列索引自动补齐
3、从列表类型的字典创建
dt = {'one':[5,4,3,2], 'two':[9,8,7,6]}
f = pd.DataFrame(dt, index=['a','b','c','d'])
DataFrame类型操作:
1、重新索引:.reindex()能够改变或重排Series和DataFrame索引
d = d.reindex(index=['c1','c2','c3','c4'], columns=['a4','a3','a2','a1'])
2、删除指定索引:
d.drop(['a','c']) #同时删除两个索引需要[]
d.drop('c5')