大数据Python基础之Series数据结构学习

1.Series是在Pandas库中出现的数据结构,适用于科学计算。
每个Series对象实际上都有两个互相关联的数组组成,其中主数组用来存放数据,主数组的每个元素都有一个与之相关联的标签,这些标签存储在另一个叫作Index的数组中,如果不指定索引,默认生成的索引是0到N-1。通过Series对象的values和index属性分别获得对应的值和索引。

import pandas as pd
obj = pd.Series([6, 2, -2, 0])
print obj
print obj.dtype
print obj.values
print obj.index

输出:
0 6
1 2
2 -2
3 0
int64
[ 6 2 -2 0]
array([0, 1, 2, 3], dtype=int64)
2.创建Series

# 利用实数
a = pd.Series(3, index=list("abc"))
# 利用列表
b = pd.Series(list("he"))
# 利用元组
c = pd.Series(tuple("he"))
# 利用ndarray数组
d = pd.Series(np.zeros(3))
# 利用字典
e = pd.Series({"name":"wang", "age":"12"})
print a, '\n', b, '\n',  c, '\n', d, '\n', e, '\n'

输出:
a 3
b 3
c 3
0 h
1 e
0 h
1 e
0 0
1 0
2 0
age 12
name wang
3.Series与字典的关系
Series不仅可以从字典创建,也可以认为Series是一个长度固定且有序的字典。Series将索引值和数据值按位置配对,在使用字典的上下文中都可以使用Series,通过字典生成Series,默认自动排序,也可以指定索引顺序。没有数据的补NaN,没有索引的排除。
4.Series对象属性
Series的name属性。索引的name属性,索引值也可以通过赋值方式改变。

aa = pd.Series([1, 2, 3], index=list("abc"))
aa.name = "Newname"
aa.index.name = "Newindex"
aa.index =["aa", 'bb', 'cc']
print aa

输出:
aa 1
bb 2
cc 3
Name: Newname
5.Series对象的NumPy风格操作
Series本质上是一个NumPy的数组,因此NumPy的数组处理函数可以直接对Series进行处理。可以使用布尔值数组进行过滤,与标量相乘,应用数学函数,索引值不会参与运算。

o = pd.Series([1, 2, -1, 0])
print o*2
print o[o > 0]
print np.exp(o)

输出:
0 2
1 4
2 -2
3 0
0 1
1 2
0 2.718282
1 7.389056
2 0.367879
3 1.000000

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值