python词频统计_Python练习题:词频统计

列表ls中存储了我国很多所高校所对应的学校类型,请以这个列表为数据变量,完善Python代码,统计输出各类型的数量ls = ["综合", "理工", "师范", "农林", "军事", "综合", "综合", "综合", "理工", "理工", "军事", "师范", "师范", "综合"]

方法1 :利用collections的子类Counter从大到小排序ls = ["综合", "理工", "师范", "农林", "军事", "综合", "综合", "综合", "理工", "理工", "军事", "师范", "师范", "综合"]

from collections import defaultdict

from collections import Counter

ls_dict = defaultdict(lambda : 0)

for item in ls:

key = item

ls_dict[key] += 1

print(ls_dict)

# 结果:defaultdict( at 0x00000000010BE048>, {'师范': 3, '农林': 1, '军事': 2, '理工': 3, '综合': 5})

print(Counter(ls_dict).most_common())

# 结果:[('综合', 5), ('师范', 3), ('理工', 3), ('军事', 2), ('农林', 1)]

方法2:

利用zip + sorted函数, sorted可以对列表进行从小到大排序,对于字典,sorted默认只按照dict的key进行排序,所以要对dict进行调整变形;

利用zip函数把dict转换成一个列表,列表中每个元素都是一个元组,元组大小比较原理是,先比较第一个元素,相同的话在比较第二个;

利用sorted函数对转换后的列表进行排序;ls = ["综合", "理工", "师范", "农林", "军事", "综合", "综合", "综合", "理工", "理工", "军事", "师范", "师范", "综合"]

d = {}

for word in ls:

d[word] = d.get(word, 0) + 1

print(d)

# 结果: {'理工': 3, '综合': 5, '师范': 3, '农林': 1, '军事': 2}

z = zip(d.values(), d.keys())

print(sorted(z))

# 结果: [(1, '农林'), (2, '军事'), (3, '师范'), (3, '理工'), (5, '综合')]

方法3 :

利用sorted + lambda

sorted(d.items(), key=lambda x: x[1])

第一个参数是需要排序的列表,第二个参数是指定key(列表中的每一项的第几个元素)来进行排序。

首先d.items() 返回一个列表dict_items([('综合', 5), ('师范', 3), ('农林', 1), ('理工', 3), ('军事', 2)])

sorted会对这个列表进行遍历,把list中的每一个元素,也就是每个元组当做x传入匿名函数lambda x: x[1],函数返回值为x[1]

d = {}

for word in ls:

d[word] = d.get(word, 0) + 1

print(d)

d = sorted(d.items(), key=lambda x: x[1])

print(d)

# 结果: [('农林', 1), ('军事', 2), ('师范', 3), ('理工', 3), ('综合', 5)]

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值