#-*- coding:utf-8 -*-
"""
优化词云
显示指定图片
"""
import jieba
import matplotlib.pyplot as plt
from wordcloud import WordCloud,STOPWORDS,ImageColorGenerator
from scipy.misc import imread #引入读取图片的库
import sys
#读取文件
text = open('d:\content paper\gr.csv').read()
print type(text)
#jieba分词
wordlist = jieba.cut(text,cut_all = True)
wl_space_split = ' '.join(wordlist)
#读取图片
bg_pic = imread('d:\content paper\pic.jpg')
#对分词后的词语绘制词云
my_wordcloud = WordCloud(font_path='c:\windows\Fonts\msyh.ttf', #字体
background_color = 'white', #设置图片背景为白色
mask = bg_pic, #指定输出图片形状
scale=1, #默认值为1,理解为生成图片的像素密度
stopwords = STOPWORDS, # 设置停用词
).generate(wl_space_split)
image_color = ImageColorGenerator(bg_pic) # 提取图片的色彩分布。
#可视化
plt.imshow(my_wordcloud)
plt.imshow(my_wordcloud.recolor(color_func=image_color)) # 输出时,将云图按照图片的色彩分布进行显示。
plt.axis('off')#是否显示x,y下标
plt.show()
<type 'str'>