python词云改颜色_一种用Python生成词云

一种用Python生成词云

我们在阅读一篇很长的文章时,总先看看文章的关键词来获知文章的大概内容。今天我们就来制作一个词云程序,将文章中出现次数较多的词语提取出来,生成一张词云图。

377adab44aed2e7317286aa0a4e7d98d85d6fa62.jpeg?token=de4c2bf903fff95d030a940410e39f1d

词云图的生成原理:

程序会将这篇文章中的所有词组识别出来,然后统计每个词组出现的次数,出现次数越多,词组的字号越大,最后把所有词组拼合成一张图像,也就是我们想要的词云图。我们需要把这篇文章储存在一个txt文档里,把这个文档和程序放在同一个文件夹下。

首先需要安装好了python的运行环境,并且以pycharm作为默认工具,安装所需的第三方库,它们分别是jieba 和wordcloud.安装可以参考:

https://www.jb51.net/article/141320.htm

然后开始制作词云程序。在pycharm中新建一个python文件。

首先调用jieba 和worldcloud模块。

import jieba

import worldcloud

接着,我们把储存在程序目录下的txt文档命名为”b站测试题.txt”

在程序中输入以下代码来读取这个文档。

f=open(“b站测试题.txt”,”r”,encoding=”gbk”)

现在我们要读取文档中的文字, 把它储存在一个新的变量t中

t=f.read()

然后关闭文档

f.close()

然后提取词组

Is=jieba.icut(t)

Txt=” ”.join(Is)

现在我们已经将词组提取出来并用空格分开,提取出来的词组保存在一个新的变量txt 里面

下一步我们要新建一个词云的对象, 并设定一些参数

W=wordcloud.wordcloud(width=2000,

Height=1400,

Font_path=”msyh.ttc”

)

在上面这段代码中,我们新建了一个词云的对象并将其命名为w。我们设定生成词云图片的宽度为2000像素,高度为1400像素,设定文字的字体为微软雅黑。

现在我们要把之前生成的词组变量txt导入词云对象w中。

w.generate(txt)

w.to_file(“pic.png”)

然后运行测试

打开程序所在的文件夹, 我们可以看到这里生成了一个名为pic.png的图片文件。

d1a20cf431adcbefff440515884956dba2cc9f99.jpeg?token=7a2ba8053c21896545173758d0486227

还可以进行个性化,譬如换个背景色

只需要加入一行代码:

W=wordcloud.wordcloud(width=2000,

Height=1400,

Background_color=”Grey”

Font_path=”msyh.ttc”

)

颜色可以查询下表

314e251f95cad1c8b4d7c2f85cd81f0fcb3d51e8.jpeg?token=ab671132679d712a905b9f82691c842f

也可以用16进制数值模式,以#开头的6位16进制数表示颜色,你可以在下面这个网站上找到自己想要的颜色的1 6进制颜色数值。

http://tool.oschina.net/commons?type=3

5882b2b7d0a20cf48cebd27d55ef3330adaf9901.jpeg?token=b8f7ada0480aab116f467d905c857729

也可以使用colormap改变文字颜色

还以自定义词云显示行状,譬如奔马、五角星等

我们需要准备一张白色背景的图片,将其放到程序所在的文件夹里,程序会把白色的背景抠除,将文字放在主体部分,再填充上背景颜色。这里我选了一个五角星的图片,将它放置在程序所在的目录下

现在我们需要调用一个新的库:imageio,imageio是python自带的一个库,可以用来读取图

像数据。

在程序开头添加下面的代码:

import imageio

然后建立一个变量mask来读取图像数据

Mask=imageio.imread(“五角星.png”)

然后我们需要在建立词云对象的代码中添加一行代码

W=wordcloud.wordcloud(width=2000,

Height=1400,

Font_path=”msyh.ttc”

Mask=mask,

)

运行,如下图:

8435e5dde71190ef96c6a877edfde510fcfa6041.jpeg?token=9c8b6ce673220d03564e94d26fedef01

思路参考:威海市文登区七里汤中学宋海霞《用python生成词云图》

除了用Pycharm还可以用sublime,可以参考:

https://blog.csdn.net/ydydyd00/article/details/80665028

未来的编程就这样,很多基础的功能已经函数或者库化了,直接调用就可以了。这样避免了频繁的制造锤子,但是这些库大部分都是国外开发的,国内直接“拿来主义”了,未来会有越来越多的国产库了。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值