利用python制作简单词云

最近网上有新冠肺炎疫情词云图,觉得很有趣,于是心血来潮简单地做了一下今天NBA全明星正赛的直播吧相关词云图
“词云”这个概念由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)于近日提出。他一直很关注网络内容发布的最新形式——即那些只有互联网可以采用而报纸、广播、电视等其它媒体都望尘莫及的传播方式。通常,这些最新的、最适合网络的传播方式,也是最好的传播方式。 因此,“词云”就是通过形成“关键词云层”或“关键词渲染”,对网络文本中出现频率较高的“关键词”的视觉上的突出。
词云图过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。
在这里插入图片描述首先安装wordcloud第三方库,打开cmd(win+R,输入cmd回车),输入pip安装指令

pip install wordcloud

等待下载安装以后即可

代码如下

from wordcloud import WordCloud
f = open('2020NBA全明星.txt','r',encoding='UTF-8').read()
wd = WordCloud(background_color='white',width=500,height=365,margin=2).generate(f)
wd.to_file('2020NBA全明星词云.jpg')

f为读取的txt文本,可以通过爬虫来获取(我不会),可以手动复制相关内容形成文档
wd是一个wordcloud对象,构造时可以调整其参数,比如长宽等
最后一行形成词云图。
附wordcloud部分参数描述:
width 指定词云对象生成图片的宽度,默认400像素
height 指定词云对象生成图片的高度,默认200像素
min_font_size 指定词云中字体的最小字号,默认4号
max_font_size 指定词云中字体的最大字号,根据高度自动调节
font_step 指定词云中字体字号的步进间隔,默认为1
font_path 指定字体文件的路径,默认None
max_words 指定词云显示的最大单词数量,默认200
stopwords 指定词云的排除词列表,即不显示的单词列表
mask 指定词云形状,默认为长方形,需要引用imread()函数
background_color 指定词云图片的背景颜色,默认为黑色

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值