Python数据分析——Pandas第一天之Series数据结构

骑士坑天下

已于 2023-03-30 21:46:48 修改

阅读量561

点赞数 1

分类专栏： Python数据分析文章标签： python pandas 数据分析

于 2022-09-22 21:50:12 首次发布

本文链接：https://blog.csdn.net/weixin_44435602/article/details/127000088

版权

Python数据分析专栏收录该内容

4 篇文章 1 订阅

订阅专栏

在Python数据分析中，Pandas是一个非常重要的库，其中Series是Pandas提供的一种用于存储一维数组的数据类型，类似于Excel中的列。本文将介绍如何使用Pandas中的Series数据结构。

一、Series

Series由索引index和列column组成，可以保存任何数据类型，其构造方法为：pandas.Series(data, index, dtype, name, copy)。其中：

data：一组数据（ndarray类型）
index：数据索引标签，如果不指定，默认从0开始
dtype：数据类型，默认会自动判断
name：设置Series名称
copy：拷贝数据，默认为False

1.1 创建数组

我们可以使用pd.Series()方法创建一个Series对象。例如，我们有一个列表a=[1,2,3]，可以通过以下方式创建一个Series：

import pandas as pd
a = [1, 2, 3]
test = pd.Series(a)
print(test)

# 结果：
#索引	#数据
#0  	 1
#1   	 2
#2   	 3
#dtype: int64 #数据类型

上述结果显示了Series对象的索引和数据。默认情况下，索引从0开始递增。在这个例子中，我们没有指定索引，所以Pandas自动给每个元素分配了一个整数值作为索引。

1.2、指定索引值

除了默认索引，我们还可以为Series对象指定自定义的索引值。例如：

import pandas as pd
a = [1, 2, 3]
test = pd.Series(a)
#索引值
print(test[1])
# 结果：2

#自定义索引值
test1 = pd.Series(a, index=['x', 'y', 'z'])
print(test1)
# 结果：
#x    1
#y    2
#z    3
#dtype: int64

# 同样也可搜索索引
print(test1['y'])
# 结果：2

上述代码中，我们首先创建一个Series对象test，并打印出了它的第二个元素（索引为1），即输出结果为2。然后，我们通过指定索引值x、y、z来创建了另一个Series对象test1，并打印出了索引为y的元素，即输出结果为2。

1.3 类似字典来创建Series

我们还可以使用类似于字典的方式来创建Series对象。例如：

import pandas as pd
b = {1: 'a', 2: 'b', 3: 'c'}
test2 = pd.Series(b)
print(test2)
# 结果：
#1    a
#2    b
#3    c
#dtype: object

#可利用index属性，指定需要的部分的索引，只取部分数据
test3 = pd.Series(b, index=[1, 2])
print(test3)
# 结果：
#1    a
#2    b
#dtype: object

test4 = pd.Series(b, index=[1, 2], name="python")
print(test4)
#结果：
#1    a
#2    b
#Name: python, dtype: object