pandas入门(1)——Series数据结构
pandas是数据分析的首选库,基于NumPy数组构建。它含有使数据清洗和分析工作变得更快更简单的数据结构和操作工具。pandas经常和其它工具一同使用,如数值计算工具NumPy和SciPy,分析库statsmodels和scikit-learn,和数据可视化库matplotlib。
pandas是专门为处理表格和混杂数据设计的,而NumPy更适合处理统一的数值数组数据。
引入pandas, Series, DataFrame:
import pandas as pd
from pandas import Series, Dataframe
Series数据结构
Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成,如
obj=pd.Series([4,7,-5,3])
obj
备注:Series的字符串表现形式为:索引在左边,值在右边。由于我们没有为数据指定索引,于是会自动创建一个0到N-1(N为数据的长度)的整数型索引。
创建的Series带有一个可以对各个数据点进行标记的索引
obj.index = ['Bob', 'Steve', 'Jeff', 'Ryan']
obj
o