numpy和pandas中的Series不同,不能直接用values_count()做统计
如:生成一个包含10000个1~6的列表
import numpy as np
import pandas as pd
random_data=np.random.randint(1,7,10000)
random_data.mean() #均值
random_data.std() #标准差
尝试用value_counts()方法,统计不同元素的个数,报以下错误。
random_data.value_counts()
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-32-2f4c42b180a9> in <module>
----> 1 random_data.value_counts()
AttributeError: 'numpy.ndarray' object has no attribute 'value_counts'
可以用以下两种方法做列表元素个数的统计。
#第一种
unique,count=np.unique(random_data,return_counts=True)
data_count=dict(zip(unique,count))
#第二种
import collections
data_count2=collections.Counter(random_data)
Counter({1: 1637, 2: 1686, 6: 1604, 5: 1678, 3: 1728, 4: 1667})
返回的是一个dict字典,可以用data_count2.keys()和data_count2.values()取相应的key值和value值