什么是词云?

1. 定义

         “词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。

        词云”就是数据可视化的一种形式。给出一段文本的关键词,根据关键词的出现频率而生成的一幅图像,人们只要扫一眼就能够明白文章主旨。

如下图:

 

2. 词云的生成

工具:

  1. matplotlib
    matplotlib,不用多讲,用python学习过机器学习的人都知道,是一个绘图库,最终词云的绘制需要用到它。

  2. jieba
    jieba,最好用的开源中文分词工具。他最主要的两个功能是分词和关键词的抽取。在词云的生成过程中都需要用到。

  3. wordcloud
    wordcloud是一个词云生成器,只要进行相关的配置就能生成相应的词云。

实现的过程简单来讲,两步走,1. 提取关键词,2. 生成词云。

关于如何使用代码生成词云,参考:

https://blog.csdn.net/weixin_43926091/article/details/85078763

https://www.cnblogs.com/Leo_wl/p/7643308.html

 

 

 

  • 2
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值