Pandas数据结构-Series

pandas主要数据对象为Series和DataFrame。
Series
Series是一个一维类似数组对象,包含一个数组的数据和一个与数组关联的数据标签。
若不指定索引值,则默认从0开始计数。可以分别使用values和index属性来获取Series的数值和索引值。例如:

ser1=pd.Series([1,3,4,3])
print(ser1.values)
print(ser1.index)

>>[1 3 4 3]
>>RangeIndex(start=0, stop=4, step=1)

同时,也可以创建一个带索引的Series对象。例如:

ser2=pd.Series([1,3,4,3], index=['a','b','v','d'])
print(ser2)

>>  a    1
    b    3
    v    4
    d    3
    dtype: int64

index的值可以进行修改,ser.index=range(len(ser))将index的值修改成了从0开始。或者直接赋值更改。
可以直接将dict中的值存入Series中。例如:

dict1={'b': 1, 'a': 2, 'c': 3}
ser3=pd.Series(dict1)
print(ser3)

>>  a    2
    b    1
    c    3
    dtype: int64

可以看出,dict中的索引通过排序后存入Series中。
Series也可以转换为dict。将series中的index作为keys,对应的值作为dict的values。例如:

ser2=pd.Series([1,3,4,3], index=['a','b','v','d'])
dict2=dict(ser2)
print(dict2)

>>{'a': 1, 'b': 3, 'v': 4, 'd': 3}

Series中检测数据丢失,可使用ser.isnull(),若返回值为True,则数据丢失。
Series可以直接使用索引值来获取value或者修改value。例如:

ser2=pd.Series([1,3,4,3], index=['a','b','v','d'])
print(ser2['d'])
ser2['b']=7
print(ser2)

>>  3
    a    1
    b    7
    v    4
    d    3
    dtype: int64

或者使用replace属性,例如ser.replace(1,11)将1替换成11。
在算术运算中,Series会自动对齐不同索引的数据。
Series对本身和索引都有一个name属性,可使用ser.name和ser.index.name获取。
对Series升序降序排列,可以使用:

data.sort_values(ascending = False) #降序排列
data.sort_values(ascending = True) #升序排列

求Series的累计和可以使用:

data.cumsum()
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值