pandas / python使用技巧-统计频次,超级实用

pandas使用技巧-统计元素频数

之所以会写这篇文章是因为经常会做词云图,而做词云图一个很重要的因素就是要事先知道每个元素的出现的频数:也就是说通过它们出现次数的多少来决定它们的重要性,所以需要事先将它们的次数统计出来。

模拟数据

import pandas as pd
import numpy as np
from collections import Counter

name_list = ["小明","小红","张三","李四","关宇"]

# 从上面的name_list中随机抽取1000个名字,有放回的抽取,所以结果中会有重复
data = list(np.random.choice(name_list,1000,replace=True))  #  生成列表形式
data[:20]

需求:现在我们的需求就是统计上面的列表中每个名字出现了多少次

通过Python字典获取

dic = {}
for key in data:
    dic[key] = dic.get(key,0) + 1

dic

  • key – 字典中要查找的键。
  • default – 如果指定键的值不存在时,返回该默认值。

利用collections下面的Counter类

from collections import Counter

result = Counter(data)
result 

看下官网demo和统计出现最多的两个名字:

利用pandas中的value_counts()方法

这个方法太👍了

一切看似逝去的,都不曾离开,你所给与的爱与温暖,让我执着地守护着这里。

尤而小屋,一个温馨的小屋。小屋主人,一手代码谋求生存,一手掌勺享受生活,欢迎你的光临😃

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值