来源:http://www.chenxm.cc/post/333.html?segmentfault,http://www.pythoner.com/205.html
第一种使用标准库提供的collections:
from collections import Counter
import numpy
num=1000000
lst = np.random.randint(num / 10, size=num)
res = Counter(lst) # 返回的值是字典格式如{'xx':8,'xxx':9}
Counter(words).most_common(4) # 输出的是出现次数最后的数据如[('xxx', 8), ('xxx', 5),]
其中collection的most_common(n)的使用方法如下,当元素的重复次数一致时不区分先后:
st_common()方法Python
>>> c = Counter('abracadabra')
>>> c.most_common()
[('a', 5), ('r', 2), ('b', 2), ('c', 1), ('d', 1)]
>>> c.most_common(3)
[('a', 5), ('r', 2), ('b', 2)]
第二种使用numpy模块(更快)
import numpy
num=1000000
lst = np.random.randint(num / 10, size=num)
list(zip(*np.unique(lst, return_counts=True)))#以list的方式,可通过[][]的方式返回具体元素
第三种使用list.count()方法(最慢)
import numpy
num=1000000
lst = np.random.randint(num / 10, size=num)
dic = {}
for i in lst:
dic[i] = lst.count(i)