数据挖掘之wordcloud词云

#-*- coding:utf-8 -*-

"""
优化词云
显示指定图片
"""

import jieba
import matplotlib.pyplot as plt
from wordcloud import WordCloud,STOPWORDS,ImageColorGenerator
from scipy.misc import imread  #引入读取图片的库
import sys

#读取文件
text = open('d:\content paper\gr.csv').read()
print type(text)

#jieba分词
wordlist = jieba.cut(text,cut_all = True)
wl_space_split = ' '.join(wordlist)

#读取图片
bg_pic = imread('d:\content paper\pic.jpg')


#对分词后的词语绘制词云
my_wordcloud = WordCloud(font_path='c:\windows\Fonts\msyh.ttf',  #字体
                background_color = 'white',             #设置图片背景为白色
                mask = bg_pic,     #指定输出图片形状
                scale=1,      #默认值为1,理解为生成图片的像素密度
                stopwords = STOPWORDS,         # 设置停用词
                ).generate(wl_space_split)


image_color = ImageColorGenerator(bg_pic)              # 提取图片的色彩分布。

#可视化
plt.imshow(my_wordcloud)
plt.imshow(my_wordcloud.recolor(color_func=image_color))  # 输出时,将云图按照图片的色彩分布进行显示。
plt.axis('off')#是否显示x,y下标
plt.show()
<type 'str'>

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值