WordCloud词云图生成
import os
import re
import jieba
import imageio
from wordcloud import WordCloud, ImageColorGenerator
读入文本,只取中文内容,然后使用 jieba 进行中文分词
with open('背影.txt', encoding='utf-8') as f:
txt = jieba.lcut(''.join(re.findall('[\u4e00-\u9fa5]',f.read())))
f.close()
txt
Building prefix dict from the default dictionary ...
Loading model from cache C:\Users\wangxb\AppData\Local\Temp\jieba.cache
Loading model cost 0.526 seconds.
Prefix dict has been built successfully.
['我',
'与',
'父亲',
'不',
'相见',
'已',
'二年',
'余',
'了',
'我',
'最',
'不能',
'忘记',
'的',
'是',
'他',
'的',
'背影',
'那年',
'冬天',
'祖母',
'死',
'了',
'父亲',
'的',
'差使',
'也',
'交卸',
'了',
'正是',
'祸不单行',
'的',
'日子',
'我',
'从',
'北京',
'到',
'徐州',
'打算',
'跟着',
'父亲',
'奔丧',
'回家',
'到',
'徐州',
'见',
'着',
'父亲',
'看见',
'满院',
'狼藉',
'的',
'东西',
'又',
'想起',
'祖母',
'不禁',
'簌簌',
'地',
'流下',
'眼泪',
'父亲',
'说',
'事已如此',
'不必',
'难过',
'好',
'在',
'天无绝人之路',
'回家',
'变卖',
'典质',
'父亲',
'还',
'了',
'亏空',
'又',
'借钱',
'办',
'了',
'丧事',
'这些',
'日子',
'家中',
'光景',
'很',
'是',
'惨淡',
'一半',
'为了',
'丧事',
'一半',
'为了',
'父亲',
'赋闲',
'丧事',
'完毕',
'父亲',
'要',
'到',
'南京',
'谋事',
'我',
'也',
'要',
'回',
'北京',
'念书',
'我们',
'便',
'同行',
'到',
'南京',
'时有',
'朋友',
'约',
'去',
'游逛',
'勾留',
'了',
'一日&