【收藏】如何用Python进行文本词云可视化

文本词云可视化的流程主要有:文本获取、词组生成,停用词定义、词云出图。这篇文章将依次介绍

文本获取

文本获取可以通过网页爬虫、自定义文本等方式获得,将文本存放于一个txt文件内方便程序读取文本

词组生成

对于中文文本,主要使用python 中的jieba库进行中文文本分词,jieba库的介绍可见Python jieba中文分词库介绍

停用词定义

获取到词组之后,经常会有一些我们不需要的词语会出现在词组里面,这里我们可以定义停用词来把它们去除

词云出图

词云出图最普遍使用的是WordCloud 库,wordcloud.WordCloud这个函数就实现了丰富的词云可视化功能。

色带颜色设置可以参考
【收藏】如何优雅的在 Python matplotlib 中可视化矩阵,以及cmap色带设置

示例代码

本示例代码加入了词云可视化中的以下功能

  1. 图片大小设置
  2. 透明的背景设置
  3. 最大的词数量设置
  4. 停用词设置
  5. 字体色带设置
  6. 字体大小设置
  7. 字体设置</
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Think Spatial 空间思维

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值