python水浒传名字次数_水浒传top20人物出现名字次数

使用Python的jieba分词库分析《水浒传》文本,排除常见非人名词汇,统计并排序角色出现次数,绘制词云图展示前20位人物。
摘要由CSDN通过智能技术生成

下面代码是使用python的分词和词云绘制的水浒top20人物出现的次数

from wordcloud import WordCloud

import jieba

import imageio

mask = imageio.imread('./su/1.png') #要绘制词云的形状

# 读取小说内容

with open('./su/水浒.txt', 'r', encoding='utf-8') as f:

words = f.read()

# counts用于存放出现的名字与次数

counts = {} # {‘曹操’:234,‘回寨’:56}

# 将不是人名(或者代表某个确定人,例孔明曰)的词放入excluds中

excludes = {"两个", "一个", "只见", "如何", "那里", "哥哥", "不能", "如此", "说道",

"军马", "次日", "军士", "头领", "左右", "一齐", "引兵", "里面", "梁山泊",

"只得", "于是", "今日", "不敢", "知府", "都督", "人马", "不知", "先锋",

"前面", "将来", "弟兄", "众人", "这里",

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值