Python数据分析——Pandas第一天之Series数据结构

在Python数据分析中,Pandas是一个非常重要的库,其中Series是Pandas提供的一种用于存储一维数组的数据类型,类似于Excel中的列。本文将介绍如何使用Pandas中的Series数据结构。

一、Series

Series由索引index和列column组成,可以保存任何数据类型,其构造方法为:pandas.Series(data, index, dtype, name, copy)。其中:

data:一组数据(ndarray类型)
index:数据索引标签,如果不指定,默认从0开始
dtype:数据类型,默认会自动判断
name:设置Series名称
copy:拷贝数据,默认为False

1.1 创建数组

我们可以使用pd.Series()方法创建一个Series对象。例如,我们有一个列表a=[1,2,3],可以通过以下方式创建一个Series:

import pandas as pd
a = [1, 2, 3]
test = pd.Series(a)
print(test)

# 结果:
#索引	#数据
#0  	 1
#1   	 2
#2   	 3
#dtype: int64 #数据类型

上述结果显示了Series对象的索引和数据。默认情况下,索引从0开始递增。在这个例子中,我们没有指定索引,所以Pandas自动给每个元素分配了一个整数值作为索引。

1.2、指定索引值

除了默认索引,我们还可以为Series对象指定自定义的索引值。例如:

import pandas as pd
a = [1, 2, 3]
test = pd.Series(a)
#索引值
print(test[1])
# 结果:2

#自定义索引值
test1 = pd.Series(a, index=['x', 'y', 'z'])
print(test1)
# 结果:
#x    1
#y    2
#z    3
#dtype: int64

# 同样也可搜索索引
print(test1['y'])
# 结果:2

上述代码中,我们首先创建一个Series对象test,并打印出了它的第二个元素(索引为1),即输出结果为2。然后,我们通过指定索引值x、y、z来创建了另一个Series对象test1,并打印出了索引为y的元素,即输出结果为2。

1.3 类似字典来创建Series

我们还可以使用类似于字典的方式来创建Series对象。例如:

import pandas as pd
b = {1: 'a', 2: 'b', 3: 'c'}
test2 = pd.Series(b)
print(test2)
# 结果:
#1    a
#2    b
#3    c
#dtype: object

#可利用index属性,指定需要的部分的索引,只取部分数据
test3 = pd.Series(b, index=[1, 2])
print(test3)
# 结果:
#1    a
#2    b
#dtype: object

test4 = pd.Series(b, index=[1, 2], name="python")
print(test4)
#结果:
#1    a
#2    b
#Name: python, dtype: object

上述代码中,我们首先创建了一个字典b,然后将其转换为一个Series对象test2,输出结果中显示了每个键值对应的值。接着,我们使用了index属性来只取部分数据,最后,我们为Series对象test4设置了名称python。

本文介绍了Pandas中的Series数据结构,包括如何创建Series对象、如何指定索引值以及如何使用类似字典的方式来创建Series对象。掌握了这些基本内容后,我们就可以在数据分析中灵活地使用Pandas中的Series了。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值