dataframe里面的一列数据就是series类型
- 声明一个series数据类型 pd.Series()
obj = pd.Series([1,2,3,4,5])
d = pd.Series(['a','b','c','d'], index=[4,5,6,7]) #自己定义索引
4 | a |
---|---|
5 | b |
6 | c |
7 | d |
d2 = {'a':10000,'b':20000,'c':30000} ##字典类型
obj = pd.Series(d2)
a | 10000 |
---|---|
b | 20000 |
c | 30000 |
- 查看series的值和索引
obj.values #array([1, 2, 3, 4, 5], dtype=int64)
obj.index #RangeIndex(start=0, stop=5, step=1)
- 缺失值的发现
#返回True和False
obj.isnull()
pd.isnull(obj)
pd.notnull(obj)
- series的算数运算
两个Series在进行运算的时候,不重叠的地方是空值,重叠的地方进行运算
d1
a -1.3
b -1.5
c -2.6
d 3.9
e 9.8
d2
a 1.3
b 1.5
c 2.6
d -3.5
d1+d2
a 0.0
b 0.0
c 0.0
d 0.4
e NaN