【Pandas】-Series数据类型



一、Series介绍

import pandas as pd

1.性质:

  • Series是Pandas中两种数据结构之一,可以看作是可自定义索引名称(标签)的一维数组,是构建数据框(DataFrame)的基本组成部分。

  • 大小不变性:类似String不可修改,append、del、drop等均为创建新的Series对象

  • 缺失数据类型:用 NaN(Not a Number)来表示缺失或无值

二、Series的参数

1.六个可选参数:

pd.Series(data=None,index=None,dtype=None,name=None,copy=False,fastpath=False)

2.参数解释

  1. data: 可以是各种数据类型,比如字典、列表、NumPy数组或标量值。

    • 字典:键值对将转换为索引和值。
    • 列表或数组:将转换为一维数组。
    • 标量值:将被重复,以适应索引的长度。
  2. index: 可选参数,用于指定Series的索引。如果没有提供,默认索引为从0到N-1(N为数据长度)的整数索引。

    • 注意:如果data是字典,index参数将覆盖字典的键。
  3. dtype: 数据类型,指定Series中元素的数据类型。如果没有指定,Pandas将会根据传入的数据自动推断。

  4. name: 可选参数,给Series命名,可以在后续的操作中使用这个名字。

  5. copy: 布尔值,默认为False。是否复制数据。如果是True,则总是复制数据(即使数据已经是所需的类型)。

  6. fastpath: 内部参数,默认为False。这个参数不建议用户使用,是Pandas内部优化的一部分。

三、Series的常见方法与属性

import pandas as pd

data = [10, 20, 30, 40]
index = ['a', 'b', 'c', 'd']
s = pd.Series(data, index=index)

增删查改

# 删除
del s['a']
s=s.drop(['a'])

# 增加
s['e'] = 50

# 查找
s['a']

统计方法

  • sum():计算Series的总和。
  • mean():计算Series的平均值。
  • median():计算Series的中位数。
  • mode():计算Series的众数。
  • std():计算Series的标准差。
  • min():返回Series的最小值。
  • max():返回Series的最大值。
  • count():返回Series中非空元素的数量。
  • describe():生成描述性统计信息。

Series的属性

  • index:返回Series的索引。
  • values:返回Series的值。
  • name:返回Series的名称。
  • dtype:返回Series的数据类型。
  • size:返回Series的大小(元素的数量)。
  • shape:返回Series的形状(通常是单一维度)。
  • is_unique:如果Series中的元素是唯一的,返回True
  • is_monotonic:如果Series中的值是单调递增的,返回True
  • empty:如果Series为空,返回True

数据操作

  • head(n):返回Series的前n个元素。
  • tail(n):返回Series的后n个元素。
  • append(series):将另一个Series对象添加到当前Series末尾。
  • drop(labels):删除指定索引或索引列表的元素。
  • sort_values():根据值排序Series
  • sort_index():根据索引排序Series
  • apply(func):将函数func应用于Series的每个元素。

数据索引和选择

  • loc:基于标签进行索引和选择。
  • iloc:基于整数位置进行索引和选择。
  • at:基于标签进行快速标量访问。
  • iat:基于整数位置进行快速标量访问。

loc:基于标签进行索引和选择

located定位

loc 方法用于通过标签(索引名称)来选择数据。这种方法允许你通过标签来选择行和列。

示例:
import pandas as pd

# 创建一个带有自定义索引的Series
data = [10, 20, 30, 40]
index = ['a', 'b', 'c', 'd']
s = pd.Series(data, index=index)

# 通过标签选择单个元素
print(s.loc['b'])  # 输出:20

# 通过标签选择多个元素
print(s.loc[['a', 'c']])  # 输出:a    10
                          #      c    30
                          #      dtype: int64

iloc:基于整数位置进行索引和选择

int located 基于整数定位

iloc 方法用于通过整数位置来选择数据。这种方法允许你通过位置来选择行和列。

示例:
# 通过整数位置选择单个元素
print(s.iloc[1])  # 输出:20

# 通过整数位置选择多个元素
print(s.iloc[[0, 2]])  # 输出:a    10
                       #      c    30
                       #      dtype: int64

at:基于标签进行快速标量访问

at 方法用于通过标签快速访问单个元素。这种方法类似于 loc,但只用于访问单个元素,效率更高。

示例:
# 快速访问单个元素
print(s.at['b'])  # 输出:20

iat:基于整数位置进行快速标量访问

iat 方法用于通过整数位置快速访问单个元素。这种方法类似于 iloc,但只用于访问单个元素,效率更高。

示例:
# 快速访问单个元素
print(s.iat[1])  # 输出:20
  • 15
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值