函数功能
返回Series中每个取值的出现次数,例如,[1,2,3,3,2,2,2,4],其中1出现一次,2出现四次等。返回值类型为Series。结果对象按降序排列,因此第一个元素是最频繁出现的元素。默认情况下不包含NA值。
函数原型
Series.
value_counts
(self, normalize=False, sort=True, ascending=False, bins=None, dropna=True)
函数属性信息
举个例子
>>> index = pd.Index([3, 1, 2, 3, 4, np.nan])
>>> index.value_counts()
3.0 2
4.0 1
2.0 1
1.0 1
dtype: int64
>>> s = pd.Series([3, 1, 2, 3, 4, np.nan])
>>> s.value_counts(normalize=True)
3.0 0.4
4.0 0.2
2.0 0.2
1.0 0.2
dtype: float64
# bins便于将连续变量转为分类变量;不是对值进行计数,而是在指定数量的半开的箱子中划分索引。
>>> s.value_counts(bins=3)
(2.0, 3.0] 2
(0.996, 2.0] 2
(3.0, 4.0] 1
dtype: int64
>>> s.value_counts(dropna=False)
3.0 2
NaN 1
4.0 1
2.0 1
1.0 1
dtype: int64