使用python制作词云
环境问题:
制作词云需要使用wordcloud,matplotlib模块,wordcloud中要使用空格隔开的文本。
windows下据说是要使用Anaconda,我是在linux下操作的,直接命令装环境就行了
分开文本,英文比较方便,中文分开文本,中文可以使用jieba模块。先不说这一部分
先看代码:
# coding=utf-8
from wordcloud import WordCloud
import sys, cv2
filename = sys.argv[1]
mytext = open(filename, encoding='utf8').read() # 打开文本
wc1 = WordCloud(
background_color='Black', # 背景色
width=2000, # 宽度
height=1000, # 高度
font_path='STXINWEI.TTF', # 字体文件,此处与py文件放在同一目录
margin=1 # 词语边缘距离
)
wc2 = wc1.generate(mytext) # 绘制词云
'''保存图片'''
filename = '{}.png'.format(filename)
wc2.to_file(filename)
'''显示图片'''
img = cv2.imread(filename)
cv2.imshow('img', img)
cv2.waitKey(0)
使用时:
python3 test.py mytext.txt
本处使用的文本文件内的数据已经是空格分开的文本。
也可以使用使用matplotlib,matplolib中pyplot的代码需要修改dpi的,否则生成的词云不清晰,词云太小,pyplot默认的dpi是100,使用默认dpi会使图片很小,稍微放大就不能看了。我修改的600。具体多少看自己。推荐使用上面一份代码。
第二份代码:
# pyplot保存,显示图片
from matplotlib import pyplot as plt
plt.rcParams['figure.dpi'] = 600 # 修改dpi
plt.rcParams['savefig.dpi']=600 # 修改dpi
plt.axis('off')
plt.imshow(wc2)
plt.savefig('{}.jpg'.format(filename))
plt.show()
上效果图:
英文的:
中文的