哈喽大家好。今天小编来教大家用Python制作大数据。今天我们来生成词云(WordCloud),过程非常简单,下面我们开始吧!
|wordcloud
大家知道为什么小编不大写吗?因为如果大写,就会出错。小编就出错了。
wordcloud是Python扩展库中一种将词语用图片表达出来的一种形式,通过词云生成的图片,我们可以更加直观的看出某篇文章的故事梗概。
首先贴出一张词云图(以哈利波特小说为例):
好看吧。在生成之前,我们先要安装wordcloud库和matplotlib库。
使用pip安装:
pip install wordcloudpip install matplotlib
在使用pip安装时,小编曾经告诉过大家使用其他网站的镜像资源,下面小编来介绍一下~
|pip其他镜像资源
常用的镜像安装源网站
(1)阿里云http://mirrors.aliyun.com/pypi/simple/
(2)豆瓣http://pypi.douban.com/simple/
(3)清华大学https://pypi.tuna.tsinghua.edu.cn/simple/
(4)中国科学技术大学http://pypi.mirrors.ustc.edu.cn/simple/
(5)华中科技大学http://pypi.hustunique.com/
例如:使用pip 豆瓣的镜像源来安装 numpy
pip install numpy
更改为:
pip install numpy -i “https://pypi.doubanio.com/simple/”
|制作过程
首先,我们要有一个txt文件,要是一篇文章,我这里以昨天的C++文章为例:C++零基础入门学习:数据的输入与输出及演示示例
我们首先介绍一下wordcloud的用法:
下面我们来制作一个普通的词云案例:
#----codeing utf-8----import wordcloud#导入词云库from wordcloud import WordCloud #导入图像处理库import osfrom os import pathfrom matplotlib import pyplot as plttext = open('word.txt','r', encoding='UTF-8')text = ' '.join(text)wc = WordCloud(font_path='/font/msyh.ttc', background_color='white').generate(text)#打开文件并设置参数fig = plt.figure(1)plt.imshow(wc)plt.axis('off')plt.show()#输出词云
运行结果:
是不是很漂亮?
下面我们来制作一个图片样式的词云:
代码:
#----codeing utf-8----import wordcloud#导入词云库from wordcloud import WordCloud #导入图像处理库from PIL import Imageimport numpy as npfrom matplotlib import pyplot as plttext = open("word.txt",encoding='utf8').read()text = text.replace('\n',"").replace("\u3000","")# 主要区别background = Image.open("D:\文件夹\xxx.jpg")graph = np.array(background)word_cloud = WordCloud(font_path="/font/msyh.ttc", background_color="white", mask=graph) # 指定词云的形状word_cloud.generate(text)plt.subplots(figsize=(12,8))plt.imshow(word_cloud)plt.axis("off")plt.show()
运行结果:
至于边上的文字,小编也不知道怎么回事,可能是比较暗吧。
|总结
本程序非常简单,还记得爬虫的朋友们可以爬取网络信息并做成词云大数据分析。如果你觉得有趣,可以点在看分享,让更多人看到哦!