目录
3.1 head:返回Series的前几个元素,默认为前5个
3.2 tail:返回Series的后几个元素,默认为后5个
3.9 value_counts:返回Series中的每个值的出现次数
3.12 replace:用指定的值替换Series中的特定值
一、前言
当谈论数据分析和数据处理的时候,Pandas是一个非常重要的Python库。Pandas让数据的操作变得非常简单,而且它也提供了很多方便的功能,如数据清洗、数据重组、数据整合、数据分组等等。
在Pandas中,Series是其中一个重要的数据结构。它非常类似于一维数组,但是它还包含了标签,这意味着它可以用来处理时间序列数据,而且它也可以用来处理非数值型数据。下面是一些Series的属性和方法,以及它们的使用示例。
二、Series的属性
2.1 values:返回Series的值数组
import pandas as pd
data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
print(s.values)
# 输出:[1 2 3]
2.2 index:返回Series的索引数组
import pandas as pd
data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
print(s.index)
# 输出:Index(['a', 'b', 'c'], dtype='object')
2.3 dtype:返回Series的数据类型
import pandas as pd
data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
print(s.dtype)
# 输出:int64
2.4 size:返回Series的大小
import pandas as pd
data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
print(s.size)
# 输出:3
2.5 shape:返回Series的形状
import pandas as pd
data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
print(s.shape)
# 输出:(3,)
2.6 name:返回Series的名称
import pandas as pd
data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data, name='my_series')
print(s.name)
# 输出:my_series
三、Series的方法
3.1 head:返回Series的前几个元素,默认为前5个
import pandas as pd
data = {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5}
s = pd.Series(data)
print(s.head())
# 输出:
# a 1
# b 2
# c 3
# d 4
# e 5
# dtype: int64
3.2 tail:返回Series的后几个元素,默认为后5个
import pandas as pd
data = {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5}
s = pd.Series(data)
print(s.tail())
# 输出:
# a 1
# b 2
# c 3
# d 4
# e 5
# dtype: int64
3.3 sort_index:根据索引排序
import pandas as pd
data = {'b': 2, 'a': 1, 'c': 3}
s = pd.Series(data)
print(s.sort_index())
# 输出:
# a 1
# b 2
# c 3
# dtype: int64
3.4 sort_values:根据值排序
import pandas as pd
data = {'b': 2, 'a': 1, 'c': 3}
s = pd.Series(data)
print(s.sort_values())
# 输出:
# a 1
# b 2
# c 3
# dtype: int64
3.5 describe:返回Series的统计信息
import pandas as pd
data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
print(s.describe())
# 输出:
# count 3.000000
# mean 2.000000
# std 1.000000
# min 1.000000
# 25% 1.500000
# 50% 2.000000
# 75% 2.500000
# max 3.000000
# dtype: float64
3.6 apply:对Series的每个元素应用一个函数
import pandas as pd
data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
print(s.apply(lambda x: x ** 2))
# 输出:
# a 1
# b 4
# c 9
# dtype: int64
3.7 astype:将Series转换为指定的数据类型
import pandas as pd
data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
s = s.astype(float)
print(s.dtype)
# 输出:float64
3.8 unique:返回Series的唯一值
import pandas as pd
data = {'a': 1, 'b': 2, 'c': 3, 'd': 2}
s = pd.Series(data)
print(s.unique())
# 输出:[1 2 3]
3.9 value_counts:返回Series中的每个值的出现次数
import pandas as pd
data = {'a': 1, 'b': 2, 'c': 3, 'd': 2}
s = pd.Series(data)
print(s.value_counts())
# 输出:
# 2 2
# 1 1
# 3 1
# dtype: int64
3.10 isnull:返回Series中的空值
import pandas as pd
import numpy as np
data = {'a': 1, 'b': np.nan, 'c': 3}
s = pd.Series(data)
print(s.isnull())
# 输出:
# a False
# b True
# c False
# dtype: bool
3.11 fillna:用指定的值填充Series中的空值
import pandas as pd
import numpy as np
data = {'a': 1, 'b': np.nan, 'c': 3}
s = pd.Series(data)
s = s.fillna(0)
print(s)
# 输出:
# a 1.0
# b 0.0
# c 3.0
# dtype: float64
3.12 replace:用指定的值替换Series中的特定值
import pandas as pd
data = {'a': 1, 'b': 2, 'c': 3}
s = pd.Series(data)
s = s.replace(2, 4)
print(s)
# 输出:
# a 1
# b 4
# c 3
# dtype: int64
四、总结
本文我们学习了Pandas中Series的一些属性和方法。Series是一个非常强大和灵活的数据结构,它让数据分析和数据处理变得非常简单。在实际的数据处理中,我们可以使用Series的各种属性和方法来有效地处理和分析数据。