本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理
本文章来自腾讯云 作者:Python知识大全
词云百度百科:“词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨
先上几张图片让大家欣赏一番:
这是我之前爬取的一篇文章并进行可视化而形成的词云
在这里插入图片描述
个性化——添加了个背景图
在这里插入图片描述
一般情况下对本狗来讲, 更喜欢词云。
废话少说, 开始教程:
1
需要的模块
import jieba
import numpy as np
from PIL import Image
from wordcloud import WordCloud
from matplotlib import pyplot as plt
2
小刀试牛
首先需要进行分词,也就是将一个句子分割成一个个的词语,我这里使用的是jieba分词
import jieba
cut = jieba.cut(text) #text为