Pandas API：value_counts() 特征取值计数

最新推荐文章于 2022-09-25 12:15:26 发布

Wang_PChao

最新推荐文章于 2022-09-25 12:15:26 发布

阅读量1.7k

点赞数

分类专栏： pandas API

本文链接：https://blog.csdn.net/JT_WPC/article/details/104276438

版权

pandas API 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

函数功能

返回Series中每个取值的出现次数，例如,[1,2,3,3,2,2,2,4]，其中1出现一次，2出现四次等。返回值类型为Series。结果对象按降序排列，因此第一个元素是最频繁出现的元素。默认情况下不包含NA值。

函数原型

Series.value_counts(self, normalize=False, sort=True, ascending=False, bins=None, dropna=True)

函数属性信息

举个例子

>>> index = pd.Index([3, 1, 2, 3, 4, np.nan])
>>> index.value_counts()
3.0    2
4.0    1
2.0    1
1.0    1
dtype: int64

>>> s = pd.Series([3, 1, 2, 3, 4, np.nan])
>>> s.value_counts(normalize=True)
3.0    0.4
4.0    0.2
2.0    0.2
1.0    0.2
dtype: float64

# bins便于将连续变量转为分类变量;不是对值进行计数，而是在指定数量的半开的箱子中划分索引。
>>> s.value_counts(bins=3)
(2.0, 3.0]      2
(0.996, 2.0]    2
(3.0, 4.0]      1
dtype: int64

>>> s.value_counts(dropna=False)
3.0    2
NaN    1
4.0    1
2.0    1
1.0    1
dtype: int64