wordcloud安装_用Python实现大数据(WordCloud)

56f2886b12d5e84a2d0aebea653579b6.png

哈喽大家好。今天小编来教大家用Python制作大数据。今天我们来生成词云(WordCloud),过程非常简单,下面我们开始吧!

|wordcloud

大家知道为什么小编不大写吗?因为如果大写,就会出错。小编就出错了。

wordcloud是Python扩展库中一种将词语用图片表达出来的一种形式,通过词云生成的图片,我们可以更加直观的看出某篇文章的故事梗概。

首先贴出一张词云图(以哈利波特小说为例):

805a028ec0035189959c8d42e1c8434d.png

好看吧。在生成之前,我们先要安装wordcloud库和matplotlib库

使用pip安装:

pip install wordcloudpip install matplotlib

在使用pip安装时,小编曾经告诉过大家使用其他网站的镜像资源,下面小编来介绍一下~

|pip其他镜像资源

常用的镜像安装源网站

(1)阿里云http://mirrors.aliyun.com/pypi/simple/
(2)豆瓣http://pypi.douban.com/simple/
(3)清华大学https://pypi.tuna.tsinghua.edu.cn/simple/
(4)中国科学技术大学http://pypi.mirrors.ustc.edu.cn/simple/
(5)华中科技大学http://pypi.hustunique.com/

例如:使用pip 豆瓣的镜像源来安装 numpy

pip install numpy

更改为:

pip install numpy -i “https://pypi.doubanio.com/simple/”

|制作过程

首先,我们要有一个txt文件,要是一篇文章,我这里以昨天的C++文章为例:C++零基础入门学习:数据的输入与输出及演示示例

我们首先介绍一下wordcloud的用法:

42e7d00fc1f3d137f93a756f0efc510d.png

下面我们来制作一个普通的词云案例:

#----codeing utf-8----import wordcloud#导入词云库from wordcloud import WordCloud #导入图像处理库import osfrom os import pathfrom matplotlib import pyplot as plttext = open('word.txt','r', encoding='UTF-8')text = ' '.join(text)wc = WordCloud(font_path='/font/msyh.ttc', background_color='white').generate(text)#打开文件并设置参数fig = plt.figure(1)plt.imshow(wc)plt.axis('off')plt.show()#输出词云

运行结果:

e56d69203944a99a9c1eca7431f5cd93.png

是不是很漂亮?

下面我们来制作一个图片样式的词云:

217545b481166c9d9d32cafc50ae249d.png

代码:

#----codeing utf-8----import wordcloud#导入词云库from wordcloud import WordCloud #导入图像处理库from PIL import Imageimport numpy as npfrom matplotlib import pyplot as plttext = open("word.txt",encoding='utf8').read()text = text.replace('\n',"").replace("\u3000","")# 主要区别background = Image.open("D:\文件夹\xxx.jpg")graph = np.array(background)word_cloud = WordCloud(font_path="/font/msyh.ttc",                        background_color="white",                        mask=graph) # 指定词云的形状word_cloud.generate(text)plt.subplots(figsize=(12,8))plt.imshow(word_cloud)plt.axis("off")plt.show()

运行结果:

292471def393633d463a979dcb17ac25.png

至于边上的文字,小编也不知道怎么回事,可能是比较暗吧。

|总结

本程序非常简单,还记得爬虫的朋友们可以爬取网络信息并做成词云大数据分析。如果你觉得有趣,可以点在看分享,让更多人看到哦!

a0d216324fe637ef121612878da45e05.png

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值