1.1 什么是Series?
基本pandas的常用的基本数据结构有两种:Series与DataFrame。
Series对象的本质是由两个数组构成的,一个数组构成对象的键(index),一个数组构成对象的值(value);采用index:value的方式组织数据。
1.2 创建一个Series
import pandas as pd
series = pd.Series([1, 2, 3, 4])
print(type(series))
# <class 'pandas.core.series.Series'>
print(series)
"""
0 1
1 2
2 3
3 4
dtype: int64
"""
1.3 指定series的索引,指定index,若无指定则默认采用正序的索引
import pandas as pd
series01 = pd.Series(data=[1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
print(series01)
"""
a 1
b 2
c 3
d 4
dtype: int64
"""
1.3 通过字典来创建series,key为索引,value为值
import pandas as pd
series02 = pd.Series({'name': 'lily', 'age': 18, 'sex': 'man'})
# print(series02)
"""
name lily
age 18
sex man
dtype: object
"""
1.4 关于数据类型的问题
import pandas as pd
series03 = pd.Series(data={'a': 1}, index=['a', 'b', 'c'])
# print(series03)
"""
a 1.0
b NaN
c NaN
dtype: float64
"""
# numpy和pandas中的NaN为float类型,pandas会根据数据类型更改series的dtype类型
1.5 Series的切片与索引
series02.get('age') # 根据索引或者位置来取数据
series03[:2] # 切片取数据
series[series >= 2] # 布尔索引,查找一维数组中大于等于1的值<只适用于数值型数组>
series02.keys() # 返回series的所有索引
series02.index # 获取series的所有索引
series02.values # 获取所有series中的所有值