Python编程——词频统计(对指定的文档内容进行统计)

本文介绍了一个使用Python进行词频统计的小案例,通过读取指定文档,遍历字符,存储在字典中并进行计数,然后转换为列表排序,最终输出词频由高到低的结果。
摘要由CSDN通过智能技术生成

这个python的小案例代码量很少,功能是实现对指定的文章内容进行词频统计的功能,并实现次数的由大到小排列。

这个案例的思路如下:

  • 首先对指定的文档进行读取,采用的是with open读取指定的文档
  • 然后对读取的信息按照每个字符进行遍历,并将其存放在一个字典中
  • 如果某个字符在文档中出现过,则对这个字符加1;如果没有出现过,则赋值为1
  • 其次,将生成的字典转化为列表的形式,转化之后,对应的键值格式变为元祖的格式,{'总': 1, '结': 1}-------->[('总', 1), ('结', 1)]
  • 最后,对生成的类表进行排序,并打印出结果

词频统计

代码如下:

# 词频统计
#打开要统计的文档
with open("我的总结.txt", encoding="utf-8") as f:
    lines = f.read()
cptj = {}
#将词频统计的结果存放到一个字典中
for line in lines:
    if line in cptj:
        cptj[line] += 1
    else:
        cptj[line] = 1
#将字典转化为类表方便进行后续的处理
lcptj = list(cptj.items())
#对生成的结果进行排序,按照每个元祖下标为1的数进行排序
lcptj.sort(key=lambda x: x[1], reverse=True)
count&#
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值