1引言
本文总结Pandas中两种常用的数据类型:
(1)Series是一种一维的带标签数组对象。
(2)DataFrame,二维,Series容器
2 Series数组
2.1 Series数组构成
Series数组对象由两部分构成:
值(value):一维数组的各元素值,是一个ndarray类型数据。
索引(index):与一维数组值一一对应的标签。利用索引,我们可非常方便得在Series数组中进行取值。
如下所示,我们通过字典创建了一个Series数组,输出结果的第一列就是索引,第二列就是数组的具体值。
>>> import pandas aspd>>> a =pd.Series([102, 212, 332, 434])>>>a0 102
1 212
2 332
3 434dtype: int64
也可以在创建时手动指定索引:
>>> a = pd.Series([102, 212, 332, 434], index=['第一列', '第二列', '第三列', '第四列'])>>>a
第一列102第二列212第三列332第四列434dtype: int64
利用索引,我们可以更加方便得在数组中进行取值:
>>> a['第一列']102
>>> a[['第一列', '第二列']]
第一列102第二列212dtype: int64
当然,你也可以使用以往的数字下标从数组中取值:
>>> a[0]102
>>> a[[0,1]]
第一列102第二列212dtype: int64
2.2 创建Series数组
(1)通过list、tuple创建
>>> pd.Series([123, 321, 345,543]) #传入一个list
0 123
1 321
2 345
3 543dtype: int64>>&