使用data.value_counts()方法对Series数组中的重复元素进行统计

最新推荐文章于 2023-09-17 08:10:06 发布

梧桐雪

最新推荐文章于 2023-09-17 08:10:06 发布

阅读量4.2k

点赞数 2

分类专栏： python高级数据处理方法

本文链接：https://blog.csdn.net/weixin_41855010/article/details/104254614

版权

python高级数据处理方法专栏收录该内容

80 篇文章 12 订阅

订阅专栏

类似于excel中的分类汇总，pandas库中为Series类的数据提供了.value_counts()方法，使用这种方法就可以完成重复元素的统计工作，这个方法将返回一个新的Series数组，这个数组的index是重复元素的内容（即原来数组中出现过的值），values中则存放着这个内容出现的次数。我们可以使用以下代码来进行演示：

import pandas as pd
import random as rd
list_data = []
for i in range(8):
	list_data.append(rd.randint(0,3))
data = pd.Series(list_data)
print(data)
vc_data = data.value_counts()
print(vc_data)
print(type(vc_data))

运行之后我们可以得到以下结果：

0    0
1    1
2    0
3    3
4    1
5    0
6    2
7    2
dtype: int64
0    3
2    2
1    2
3    1
dtype: int64
<class 'pandas.core.series.Series'>
[Finished in 4.3s]