安装:
python3.6
Pycharm
解决win下安装wordcloud出错问题
使用:
这里有一篇微信公众号文章Python 爬虫实践:《战狼2》豆瓣影评分析,作为爬虫和wordcloud入门也是极好的。
可能由于包版本的问题,里面的代码需要经过简单修改才能正常运行。
修改如下:
原文章中第三部分 三 用词云进行显示 ,的代码是
import matplotlib.pyplot as plt
% matplotlib inline
import matplotlib
matplotlib.rcParams['figure.figsize'] = (10.0, 5.0)
from wordcloud import WordCloud # 词云包
wordcloud = WordCloud(font_path="simhei.ttf", background_color="white", max_font_size=80) # 指定字体类型、字体大小和字体颜色
word_frequence = {x[0]: x[1] for x in words_stat.head(1000).values}
word_frequence_list = []
for key in word_frequence:
temp = (key, word_frequence[key])
word_frequence_list.append(temp)
wordcloud = wordcloud.fit_words(word_frequence_list)
plt.imshow(wordcloud)
需要修改为
# 用词云进行显示
wordcloud = WordCloud(font_path="MSYH.TTF", background_color="white", max_font_size=80)
word_frequence = {x[0]: x[1] for x in words_stat.head(1000).values}
word_frequence_list1 = []
word_frequence_list2 = []
for key in word_frequence:
# temp = (key,word_frequence[key])
word_frequence_list1.append(key)
word_frequence_list2.append(word_frequence[key])
# word_dict
word_dict = zip(word_frequence_list1, word_frequence_list2)
word_dict = dict((name, value) for name, value in word_dict)
wordcloud = wordcloud.fit_words(word_dict)
plt.imshow(wordcloud)
plt.axis("off")
plt.show()
- 一是修改了数据类型,将word_pfrequence_list的list转换成word_dict的dict.
- 一是图片显示命令
SO
那么大的 吴亦凡 是什么鬼!
最简形式
import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt
content = '''
xxxxxxxx
'''
wordcloud = WordCloud(font_path="E:\\x\\python\\MSYH.TTF").generate(' '.join([" ".join(jieba.cut(content))]))
#' '.join([" ".join(jieba.cut(content))])
# word_list = [" ".join(jieba.cut(content))]
# new_text = ' '.join([" ".join(jieba.cut(content))])
plt.imshow(wordcloud)
plt.axis("off")
plt.show()
对,就是这样。只需要指定 字体文件font_path,和一个 一个被jieba(结巴?/笑)分过词的字符串就行了。
有不稳定因素。。
果然还是白底好看。