Pandas的Series的常见属性和方法介绍

最新推荐文章于 2024-09-15 13:29:01 发布

斩心之鬼

最新推荐文章于 2024-09-15 13:29:01 发布

阅读量1.7k

点赞数 2

分类专栏： Python学习文章标签： pandas python 数据分析

本文链接：https://blog.csdn.net/qq_21337539/article/details/131146794

版权

Python学习专栏收录该内容

16 篇文章 14 订阅

订阅专栏

一、前言

二、Series的属性

2.1 values：返回Series的值数组

2.2 index：返回Series的索引数组

2.3 dtype：返回Series的数据类型

2.4 size：返回Series的大小

2.5 shape：返回Series的形状

2.6 name：返回Series的名称

三、Series的方法

3.1 head：返回Series的前几个元素，默认为前5个

3.2 tail：返回Series的后几个元素，默认为后5个

3.3 sort_index：根据索引排序

3.4 sort_values：根据值排序

3.5 describe：返回Series的统计信息

3.6 apply：对Series的每个元素应用一个函数

3.7 astype：将Series转换为指定的数据类型

3.8 unique：返回Series的唯一值

3.9 value_counts：返回Series中的每个值的出现次数

3.10 isnull：返回Series中的空值

3.11 fillna：用指定的值填充Series中的空值

3.12 replace：用指定的值替换Series中的特定值

四、总结

一、前言

当谈论数据分析和数据处理的时候，Pandas是一个非常重要的Python库。Pandas让数据的操作变得非常简单，而且它也提供了很多方便的功能，如数据清洗、数据重组、数据整合、数据分组等等。

在Pandas中，Series是其中一个重要的数据结构。它非常类似于一维数组，但是它还包含了标签，这意味着它可以用来处理时间序列数据，而且它也可以用来处理非数值型数据。下面是一些Series的属性和方法，以及它们的使用示例。

二、Series的属性

2.1 values：返回Series的值数组

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
print(s.values)
# 输出：[1 2 3]

2.2 index：返回Series的索引数组

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
print(s.index)
# 输出：Index(['a', 'b', 'c'], dtype='object')

2.3 dtype：返回Series的数据类型

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
print(s.dtype)
# 输出：int64

2.4 size：返回Series的大小

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
print(s.size)
# 输出：3

2.5 shape：返回Series的形状

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
print(s.shape)
# 输出：(3,)

2.6 name：返回Series的名称

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data, name='my_series')
print(s.name)
# 输出：my_series

三、Series的方法

3.1 head：返回Series的前几个元素，默认为前5个

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5}
s = pd.Series(data)
print(s.head())
# 输出：
# a    1
# b    2
# c    3
# d    4
# e    5
# dtype: int64

3.2 tail：返回Series的后几个元素，默认为后5个

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5}
s = pd.Series(data)
print(s.tail())
# 输出：
# a    1
# b    2
# c    3
# d    4
# e    5
# dtype: int64

3.3 sort_index：根据索引排序

import pandas as pd

data = {'b': 2, 'a': 1, 'c': 3}
s = pd.Series(data)
print(s.sort_index())
# 输出：
# a    1
# b    2
# c    3
# dtype: int64

3.4 sort_values：根据值排序

import pandas as pd

data = {'b': 2, 'a': 1, 'c': 3}
s = pd.Series(data)
print(s.sort_values())
# 输出：
# a    1
# b    2
# c    3
# dtype: int64

3.5 describe：返回Series的统计信息

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
print(s.describe())
# 输出：
# count    3.000000
# mean     2.000000
# std      1.000000
# min      1.000000
# 25%      1.500000
# 50%      2.000000
# 75%      2.500000
# max      3.000000
# dtype: float64

3.6 apply：对Series的每个元素应用一个函数

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
print(s.apply(lambda x: x ** 2))
# 输出：
# a    1
# b    4
# c    9
# dtype: int64

3.7 astype：将Series转换为指定的数据类型

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
s = s.astype(float)
print(s.dtype)
# 输出：float64

3.8 unique：返回Series的唯一值

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3, 'd': 2}
s = pd.Series(data)
print(s.unique())
# 输出：[1 2 3]

3.9 value_counts：返回Series中的每个值的出现次数

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3, 'd': 2}
s = pd.Series(data)
print(s.value_counts())
# 输出：
# 2    2
# 1    1
# 3    1
# dtype: int64

3.10 isnull：返回Series中的空值

import pandas as pd
import numpy as np

data = {'a': 1, 'b': np.nan, 'c': 3}
s = pd.Series(data)
print(s.isnull())
# 输出：
# a    False
# b     True
# c    False
# dtype: bool

3.11 fillna：用指定的值填充Series中的空值

import pandas as pd
import numpy as np

data = {'a': 1, 'b': np.nan, 'c': 3}
s = pd.Series(data)
s = s.fillna(0)
print(s)
# 输出：
# a    1.0
# b    0.0
# c    3.0
# dtype: float64

3.12 replace：用指定的值替换Series中的特定值

import pandas as pd

data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
s = s.replace(2, 4)
print(s)
# 输出：
# a    1
# b    4
# c    3
# dtype: int64

四、总结

本文我们学习了Pandas中Series的一些属性和方法。Series是一个非常强大和灵活的数据结构，它让数据分析和数据处理变得非常简单。在实际的数据处理中，我们可以使用Series的各种属性和方法来有效地处理和分析数据。

斩心之鬼

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录