python制作词云,(中文乱码,图片小解决)

使用python制作词云

环境问题:

  制作词云需要使用wordcloud,matplotlib模块,wordcloud中要使用空格隔开的文本。

  windows下据说是要使用Anaconda,我是在linux下操作的,直接命令装环境就行了

分开文本,英文比较方便,中文分开文本,中文可以使用jieba模块。先不说这一部分

先看代码:

# coding=utf-8
from wordcloud import WordCloud
import sys, cv2

filename = sys.argv[1]
mytext = open(filename, encoding='utf8').read()  # 打开文本
wc1 = WordCloud(
    background_color='Black',  # 背景色
    width=2000,  # 宽度
    height=1000,  # 高度
    font_path='STXINWEI.TTF',  # 字体文件,此处与py文件放在同一目录
    margin=1  # 词语边缘距离
)
wc2 = wc1.generate(mytext)  # 绘制词云

'''保存图片'''
filename = '{}.png'.format(filename)
wc2.to_file(filename)

'''显示图片'''

img = cv2.imread(filename)
cv2.imshow('img', img)
cv2.waitKey(0)

 使用时:

python3 test.py mytext.txt

  本处使用的文本文件内的数据已经是空格分开的文本。

  也可以使用使用matplotlib,matplolib中pyplot的代码需要修改dpi的,否则生成的词云不清晰,词云太小,pyplot默认的dpi是100,使用默认dpi会使图片很小,稍微放大就不能看了。我修改的600。具体多少看自己。推荐使用上面一份代码。

第二份代码:

# pyplot保存,显示图片
from matplotlib import pyplot as plt

plt.rcParams['figure.dpi'] = 600  # 修改dpi
plt.rcParams['savefig.dpi']=600   # 修改dpi
plt.axis('off')
plt.imshow(wc2)
plt.savefig('{}.jpg'.format(filename))
plt.show()

 

上效果图:

英文的:

中文的


 

 

 

  • 4
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值