0704数据分析学习笔记
#八、pandas创建Series
#numpy主要用于处理数值数据,对于字符串,时间序列等多用pandas
#series是一组数组型对象,能保存任意数据类型,并会自动创建index
import pandas as pd
import numpy as np
#1、通过list创建Series
a1 = pd.Series([1,2,3,4,5])#通过list创建
#2、通过array创建\
s = np.arange(1,6)
a4 = pd.Series(s,index = ['a','b','c','d','e'])
a2 = pd.Series(np.arange(1,5),index = ['a','b','c','d'])
#3、通过字典创建Series
a3 = pd.Series({'name':'张三','age':'21','class':'0701'},index = ['class','name','age','sex'])#通过字典创建Series
a3
print(a1>2)
#九、Series基本用法
#1、isnull与notnull 检查缺失值
a3.isnull()#判断是否为空
a3.notnull()#判断是否不为空
#2、通过索引获取数据
print(a3.index)
print(a3.values)
print(a3[2])
print(a3[['class','name']])
print(a3[[1,3]])
#3、切片
a3[1:3]
a3['class':'sex']
#4、布尔索引及series运算(索引与数据的对应关系不受运算影响)
#5、name属性
a3.name = 'temp' #对象名
a3.index.name = 'year' #对象索引名
a3
a3.head()
a3.tail()