赘婿词云图制作

前言

之前的文章我们已经介绍了如何使用wordcloud库制作中英文词云图,并介绍了中英文停用词的使用方法,介绍了如何美化词云图,例如换字体背景颜色,背景换成图片等,那这次我们就以现在很火的电视剧赘婿为例,制作赘婿小说的词云图。

数据准备

  • 赘婿小说txt

  • 停用词表

  • 一张赘婿相关背景图

制作流程

  • 读取小说文本

  • 利用jieba库对文本进行分词

  • 设置停用词表

  • 利用wordcloud库制作词云图

代码

根据上面的流程,编写代码。

from matplotlib import pyplot as plt
from wordcloud import WordCloud,ImageColorGenerator
import jieba

fp = open('赘婿.txt','r')
text = fp.read()
cut_word = " ".join(jieba.cut(text))

stopwords = set()
content = [line.strip() for line in open('hit_stopwords.txt','r').readlines()]
stopwords.update(content)

background_image = plt.imread('赘婿.jpg')

wc = WordCloud(background_color = 'white',
               font_path = r'/System/Library/Fonts/Supplemental/Songti.ttc',
               stopwords = stopwords,
               mask = background_image,
               max_words=2000)
wc.generate(cut_word)

#改变字体颜色
img_colors = ImageColorGenerator(background_image)
#字体颜色为背景图片的颜色
wc.recolor(color_func=img_colors)

plt.imshow(wc, interpolation='bilinear')
plt.axis('off') #取消坐标轴
plt.show()

词云图可以看出,还是有很多次我们还需要过滤掉,这部分内容在jieba库的使用中再进行讲解。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值