Pandas
大纲
Pandas
- 具备按轴自动或显式数据对齐功能的数据结构。
- 集成时间序列功能
- 数学运算和约减
- 灵活处理缺失数据
- 合并及其他出现在常见数据库(SQL)中的关系型运算
pandas数据结构介绍
Series
Series是一种类似于一维数组的对象,表现形式:索引(index)在左边,值(value)在右边
还可以将 Series看做 是一个定长的有序字典,它是索引值到数据的一个映射
from pandas import Series,DataFrame
import pandas as pd
obj = Series([4,5,6,7])
print(obj)
obj.index = ['a','b','c','d']
print(obj)
print(obj.index)# 自动创建索引
print(obj[2]) # pandas 与numpy不同,可以通过索引选取Series中单个或一组值
# Series可以通过字典来创建
sdata = {
'dwd':3434,'tawe':3242342,'oijdf':4234234}# 左索引,右值
obj3 = Series(sdata)
print(obj3)
states = ['wafzx','dwd','tawe','oijdf']
obj4 = Series(sdata,index=states)# 会将sdata中与index相匹配的值当到相应位置
# NaN (not a number)
print(obj4)
print(pd.isnull(obj4))# 判断值是否为缺失(缺失为True)
print(pd.notnull(obj4))# 判断值是否缺失(未缺失为True)
# Series 中的index 和 本身都有一个name属性
o