python结巴分词词云图

导入结巴分词

from wordcloud import WordCloud
import jieba
# 词频计算
import jieba.analyse as analyse
from scipy.misc import imread
import os
from os import path
import matplotlib.pyplot as plt
from PIL import Image
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator

放置字体(不然会报错:OSError: cannot open resource)
simsun.ttf

os.chdir('/Users/jacquelin/Documents/文件/中大/')

comment_text = open('中大维修描述.txt','r').read()           #结巴分词
        
cut_text = " ".join(jieba.cut(comment_text))
result = jieba.analyse.textrank(cut_text, topK=1000, withWeight=True)
        
keywords = dict()

for i in result:
    keywords[i[0]] = i[1]
wc = WordCloud(font_path="simsun.ttf",  # 设置字体
               background_color="white",  # 背景颜色
               max_words=1000,  # 词云显示的最大词数
               max_font_size=500,  # 字体最大值
               min_font_size=20, #字体最小值
               random_state=42, #随机数
               collocations=False, #避免重复单词
               width=1600,height=1200,margin=10, #图像宽高,字间距
               plt.figure(dpi=xx)放缩才有效
              ).generate(cut_text) 
#wc.generate(cut_text)    

plt.figure(dpi=100) #通过这里可以放大或缩小
plt.imshow(wc, interpolation='catrom',vmax=1000)
plt.axis("off") #隐藏坐标
plt.figure()
plt.show()

ps:
初学者绘制时只需要导入结巴分词部分、替换路径里的文件
在你将数据库或者自己爬取的文本复制进txt文本,需保存为utf-8格式
在这里插入图片描述

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值