词云图之python源代码

词云图,也叫文字云,是对网络文本中出现频率较高的“关键词”予以视觉上的突出,出现的越多,显示的字体越大,就越突出,所以这个关键词也就非常的重要。让浏览者通过词云图一眼就可以快速的感知到最突出的文字,迅速的抓住重点,了解主旨。

我们简单来做一个演示,比如将西游记进行生成词云图:

看过西游记电视机的人,都知道上面一些词语是高频率,词云图就是这么神奇。

代码如下(读数据这里有一个编码,不一定是encoding='gb18030',如果报错可以试一下encoding='utf-8'):

from wordcloud import WordCloud
import jieba
import PIL
import matplotlib.pyplot as plt
import numpy as np


def wordcloudplot(txt):
    pass


def makewordc():
    a = []
    f = open(r'西游记.txt', 'r',encoding='gb18030').read()    #读数据
    words = list(jieba.cut(f))                                #分词
    for word in words:
        if len(word) > 1:
            a.append(word)
    txt = r' '.join(a)
    wordcloudplot(txt)


if __name__ == '__main__':
    makewordc()

整个工程如下:

代码的下载路径(新窗口打开链接)词云图之python源代码

有问题可以私信或者留言,有问必答

  • 9
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值