词云,也称为文字云或标签云,它主要是通过文字占的面积大小、颜色的深浅变化来呈现关键词出现的次数。文字占的面积越大,代表该词出现的次数最多,相反,文字占的面积越小,出现的次数就越少 。
在对很多文本类型数据进行分析、呈现和表达时,我们都会用到词云,比如评论留言数据、 弹幕数据、标签数据、调查数据、搜索数据等等。 通过词云这种表现形式,我们可以仅凭肉眼就快速获取关键的文字信息。
以下我们将先理顺词云的表现形式和应用场景类型。
常用的四种词云表现形式
1.基础词云
这是词云里最常使用也最简单的一种表现形式,我想大家经常会用到,它操作起来简单、粗暴,即使在不借助工具、网站的情况下,我们也可以根据数值手动调整文字的大小,来进行展现。这种类型的词云在文字整体的大小和文字方向上都可以更加自由。 当我们在做评论留言、标签、商品数据,没有一个特定主题形象的情况下,经常会直接上手做。
![36bfb623d7e5e2df55c37bd42f142b3e.png](https://img-blog.csdnimg.cn/img_convert/36bfb623d7e5e2df55c37bd42f142b3e.png)
2.形状词云
形状词云,顾名思义,就是有形状的词云。一般来说,当我们想表达的内容有明显主题时,就会使用相关的形状作为辅助,增强信息传达的效果。比如在表现健身主题相关的词云时,就可采用健身时的场景形状剪影来作为轮廓。
![329fd8a65c757a1306021c1e48806e2c.png](https://img-blog.csdnimg.cn/img_convert/329fd8a65c757a1306021c1e48806e2c.png)
在表现亲密关系时,比如《李国庆的微博怎么谈俞渝》就可通过爱心的形状来展示。在表现和钱相关的主题时,就可选择和钱相关的元素来选择形状,比如存钱罐。
![973d78522e8e1567d86a9990d060e627.png](https://img-blog.csdnimg.cn/img_convert/973d78522e8e1567d86a9990d060e627.png)
这种词云可以通过上传剪影形状来生成,后面我们具体来说。
3.圆圈词云
圆圈词云是表哥最近用得比较多的一种表现形式。前面说过,词云其实就是用文字占的面积大小来表现数值,我们稍微延展一下,将文字放到圆圈中,通过圆圈的大小来对应词频的变化。
![174bc98e28cb3cc1fd22caa603de1bc5.png](https://img-blog.csdnimg.cn/img_convert/174bc98e28cb3cc1fd22caa603de1bc5.png)
与传统词云相比呢,这种形式的词云更加直观,各个词之间的对比可以更加明显。而且,这也比较灵活,多个词云图还能放在一起进行比较。
4.方块词云
同样,我们也可以将字放在方块里,通过方块的大小来对应词频的变化。
![ce85cbc42867f014c0983675f86a92d3.png](https://img-blog.csdnimg.cn/img_convert/ce85cbc42867f014c0983675f86a92d3.png)
做词云的时候,字词的数量建议控制在10-30个以内,太多的话就会影响排版,也比较影响主要信息的传达。下篇将分享如何快速制作各类型词云。
文章部分素材源自:DT财经