一,当统计一个数据集里数据出现的频率,次数可以使用value_count
value_counts默认参数如下:
value_counts(values, sort=True, ascending=False, normalize=False, bins=None, dropna=True)
对于Series类型的数据
data.value_counts()
对于DataFrame类型的数据
data.apply(pd.value_counts)
如:
id_0 = pd.DataFrame(RF_0.replace(0,np.nan).count(axis=1))
a_0=df_0.apply(pd.value_counts)
a_0.columns=["b_0"]
a_0.head(3)
b_0
10 35376
11 31256
12 26580
二,统计某一个值的频数
不同于列表,可以直接统计某个值出现的次数,DataFrame需要做一些转换。
1,list(test_data.x1).count(‘b’)
2,sum(test_data.x1.apply(lambda x: 1 if x==‘b’ else 0))
3,test_data.x1.apply(lambda x: 1 if x==‘b’ else 0).sum()
Pandas—汇总和频数统计:https://blog.csdn.net/wendaomudong_l2d4/article/details/83039724
pandas统计重复值次数:https://blog.csdn.net/qq_30309843/articl