1引言
本文总结Pandas中两种常用的数据类型:
(1)Series是一种一维的带标签数组对象。
(2)DataFrame,二维,Series容器
Python资源共享群:626017123
2 Series数组
2.1 Series数组构成
Series数组对象由两部分构成:
- 值(value):一维数组的各元素值,是一个ndarray类型数据。
- 索引(index):与一维数组值一一对应的标签。利用索引,我们可非常方便得在Series数组中进行取值。
如下所示,我们通过字典创建了一个Series数组,输出结果的第一列就是索引,第二列就是数组的具体值。
>>> import pandas as pd >>> a =pd.Series([102, 212, 332, 434]) >>> a 0 102 1 212 2 332 3 434 dtype: int64
也可以在创建时手动指定索引:
>>> a = pd.Series([102, 212, 332, 434], index=['第一列', '第二列', '第三列', '第四列']) >>> a 第一列 102 第二列 212 第三列 332 第四列 434 dtype: int64
利用索引,我们可以更加方便得在数组中进行取值:
>>> a['第一列'] 102 >>> a[['第一列', '第二列']] 第一列 102 第二列 212 dtype: int64
当然,你也可以使用以往的数字下标从数组中取值:
>>> a[0] 102 >>> a[[0,1]] 第一列 102 第二列 212 dtype: int64
2.2 创建Series数组
(1)通过list、tuple创建