python第三方库wordcloud绘制任意形状词云教程

最新推荐文章于 2024-07-03 23:02:36 发布

Uri栗子

最新推荐文章于 2024-07-03 23:02:36 发布

阅读量9.1k

点赞数 10

分类专栏： Python应用文章标签： python wordcloud 词云

本文链接：https://blog.csdn.net/weixin_43886356/article/details/86711292

版权

这篇教程详细介绍了如何使用Python的wordcloud库创建汉字和英文词云。对于汉字，需指定font_path参数确保支持汉字的字体。而对于英文，可以通过设置mask来定义词云形状，并提供了使用不同格式图片作为遮罩的方法。教程包含无遮罩和有遮罩的运行实例及代码展示。

摘要由CSDN通过智能技术生成

此篇教程划分为两种情况，原文本为汉字和原文本为英文，教程最后有实例提供参考。

Part1 原文本为汉字

若原文本为汉字，则需要指定WordCloud方法中的font_path为要使用的汉字字体路径，因为默认的wordcloud字体DroidSansMono.ttf 不支持汉字，且指定的字体文件需要放在wordcloud安装的文件夹下，我电脑中的路径为D:\Program Files\Python37\Lib\site-packages\wordcloud\simhei.ttf

否则生成的词云图片上会是彩色方框，而不会出现汉字。

源代码如下：

import jieba
from wordcloud import WordCloud
from scipy.misc import imread
mask= imread('picture.png') #此处为使用遮罩的情况，即生成的词云形状
file = open("sample.txt", "r", encoding='utf-8')
content = file.read()
words=jieba.lcut(content)   # 使用jieba进行精确分词获取词语列表
txt