value_counts()
是Pandas中的一个函数,用于计算一个Series中每个唯一值的频数。它返回一个新的Series对象,其中索引是唯一值,而值是对应的频数。
series.value_counts(normalize=False, sort=True, ascending=False, bins=None, dropna=True)
series
:要计算频数的Series对象。
参数:
-
normalize
:默认为False
。如果设置为True
,则返回频数的相对频率,而不是绝对频数。 -
sort
:默认为True
。如果设置为True
,则按频数进行排序。如果设置为False
,则不进行排序。 -
ascending
:默认为False
。如果设置为True
,则按频数升序排序。如果设置为False
,则按频数降序排序。 -
bins
:仅适用于数值数据。如果指定了bins
参数,则将数值数据分箱,并计算每个箱子的频数。 -
dropna
:默认为True
。如果设置为True
,则排除缺失值(NaN)并计算非缺失值的频数。如果设置为False
,则包括缺失值并计算缺失值的频数。
value_counts()
函数常用于对离散变量的统计分析,如计算每个类别的频数、查找最常出现的类别或进行数据的初步探索。
import pandas as pd
data = ['A', 'B', 'A', 'C', 'B', 'A', 'B', 'C', 'D', 'D']
# 计算频数
counts = pd.Series(data).value_counts()
print(counts)
在上述示例中,value_counts()
函数计算了列表data
中每个唯一值的频数,并返回一个新的Series对象。输出结果将是每个唯一值及其对应的频数。