pandas的两大数据结构之——Series

原创已于 2022-09-22 09:36:34 修改 · 4.4k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

于 2022-03-27 11:20:13 首次发布

本文介绍Pandas库中的Series对象，包括声明、元素选择与赋值、运算及数学函数应用等核心功能。同时探讨如何筛选元素、了解元素构成，并提供实用示例。

pandas库的Scries对象用来表示一维数据结构，由两个相互关联的数组组成。主数组用来存放数据，主数组的每个元素都有一个与之相关联的标签，这些标签存储在另外一个叫作Index的数组中。

1、声明Series对象

调用Series()构造函数，把要存放在Series对象中的数据以数组形式传入。

Series的输出：左侧Index是一列标签，右侧是标签对应的元素。
声明Series时，若不指定标签，pandas默认使用从0开始依次递增的数值作为标签。
然而，最好使用有意义的标签，用以区分和识别每个元素，因此,调用构造函数时，可以指定index选项，把存放有标签的数组赋给它，其中标签为字符串类型。

如果想分别查看组成Series对象的两个数组，可像下面这样调用它的两个属性：index(索引)和values(元素)。

2、选择内部元素

指定键或者指定位于索引位置处的标签。

选择多个元素的方法与NumPy相同

或者，使用元素对应的标签（放到数组中）

3、为元素赋值

用索引或标签选取元素后进行赋值

4、用NumPy数组或其他Series对象定义新Series对象

新Series对象中的元素不是原NumPy数组或Series对象元素的副本,而是对它们的引用。如改变原有对象元素的值,新Series对象中这些元素也会发生改变。

5、筛选元素

如要获取Series对象中所有大于8的元素，可使用以下代码:

6、Series对象运算和数学函数

适用于NumPy数组的运算符（+、-、*、/)或其他数学函数，也适用于Series对象

至于NumPy库的数学函数，必须指定它们的出处np，并把Series实例作为参数传入

7、Series对象的组成元素

Series对象往往包含重复的元素，你很可能想知道里面都包含哪些元素，统计元素重复出现的次数或判断一个元素是否在Series中。
首先，声明一个包含多个重复元素的Series对象。

unique()函数：帮助弄清楚Series对象包含多少个不同的元素，其返回Series去重后的元素，顺序比较随意。

value_counts()函数：不仅返回各个不同的元素，还计算每个元素在Series中的出现次数。

isin()函数：判断给定的一列元素是否包含在数据结构之中，其返回结果是布尔值，可用于筛选Series或DataFrame列中的数据。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。