Pandas主要有两个数据结构:Series 和 DataFrame。本节主要介绍Series。
Series类似一维数组,由索引和一组数据组成,其中索引在左边,值在右边。
1、定义方式
定义方式 1):
import pandas as pd
data = pd.Series([1,2,3,4])
在未指定索引时,会自动创建一个 0 - base 的索引,类似于数据结构中的一维数组。
Series自带的属性 index 和 values可以获取索引和值,实现方式如下:
data.index
# 输出为 Int64([0,1,2,3])
data.values
# 输出为 array([1,2,3,4])
类似于一维数组,同样可以按照索引进行数据搜索,即:
data[0]
# 输出 1
定义方式 2):
如果数据以Python字典的形式存储,也可以直接通过字典创建 Series:
data = {'name':zhangsan,'age':26, 'job':programmer}
obj = pd.Series(data)
2、缺失数据
用缺失或 NA 表示缺失数据。
pandas中可以使用 isnull() 和 notnull() 函数来判断是否缺失,输出结果为 True 和 False,True表示缺失,False表示未缺失。