常用命名:
from pandas import Series, DataFrame
import pandas as pd
Series是一种类似于一维数组的对象:
它由一组数组(各种NumPy数据类型),以及一组与之相关的数据标签组成。
1. 创建 Series
obj = Series([4,7,-5,3])
obj
表现为:索引在左边,值在右边。
如果没有指定索引,会自动从0开始。
2. Series 属性, values, index
可以通过Series的values和index属性获取其数组表示形式和索引对象:
obj.values
obj.index
3. 创建Series, 带有标记索引:
obj2 = Series([4,7,-5,3], index=['d','b','a','c'])
obj2
4. 通过索引的方式选取Series中的单个或一组值:
obj2['a']
obj2[['c','a','d']]
5. NumPy数组运算会保留索引和值之间的链接
obj2[obj2 > 0]
obj2 * 2
6. 创建Series, 通过字典参数
如果只传入一个字典,则结果Series中的索引就是原字典的键。
sdata = {'Ohio':35000, 'Texas':71000, 'Oregon':16000, 'Utah':5000}
obj3 = Series(sdata)
当然也可以定义索引,但是如果不能匹配,所显示结果为NaN
states = ['California', 'Ohio', 'Oregon', 'Texas']
obj4 = Series(sdata, index=states)
7. 算术运算,计算中会自动对齐不同索引的数据
obj3 + obj4
8. Series对象本身及其索引都有一个name属性
obj4.name = 'population'
obj4.index.name = 'state'
obj4
9. Series的索引可以通过赋值的方式修改
obj.index = ['Bob', 'Steve', 'Jeff', 'Ryan']
obj