Python统计TXT词云

说明:读取一个TXT文件,然后统计其中所有的单词个数,并按照从多到少排序(python解释器版本:3.8)实例读取文件我已上传

代码:

# 练习三:统计tet单词频次:
import re

f = open('baofali.txt', encoding='gbk', errors="ignore")
txt = f.read()  # 读取文件并存放资源
# txt = f.read(100)  从头开始读取的字符数
# tetalines=f.readlines()  读取操作,读取一行为一个元素
f.close()
txt = txt.lower()  # 将字母全部转为小写
txt = re.sub('[鈥攈,.!?:攁"*\';,-,]', '', txt)  # 字符替换,去除小说中的标点符号

word = txt.split()  # 单词分割,以空格分隔
# 进行词频统计,由高到低排序
word_sq = {}
for i in word:
    if i not in word_sq.keys():
        word_sq[i] = 1
    else:
        word_sq[i] += 1
# 无法对字典本身做排序操作
res = sorted(word_sq.items(), key=lambda x: x[1], reverse=True)  # 升序排序
print(res)

输出(太长了):
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

无名之辈无名之辈

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值