项目背景虽然现在已经有很多现成的制作词云图的工具了,但一般存在以下几个问题:问题一:工具太多,眼花缭乱,质量参差不齐,选择困难症; 问题二:大多词云工具或多或少有一些限制,自定义的空间有限;问题三:有些工具甚至收费。基于以上几个问题,迪迪觉得有必要写一篇Python绘制词云图的文章,因为实在太简单!没有任何编程基础的小白都能搞定的事,还找什么工具啊!
OK,FINE。咱不废话,直接实操。项目实操一一般词云绘制
制作词云图首先得有词吧,词从哪来,迪迪想了半天硬是没想出来。既然没思路,那就拿过气的后浪软文玩一玩吧,对于后浪大家褒贬不一,迪迪也不敢妄加评论。
首先,咱们把后浪全文保存为HL.txt,截取部分,长这样:
接着,下载并导入制作词云所需的库,各个库的功能都有注释。
1import jieba #结巴分词2from wordcloud import WordCloud #词云展示库3from PIL import Image #图像处理库4import numpy as np #支持多维数组和矩阵运算5import matplotlib.pyplot as plt #图像展示库
然后,把HL.txt的内容读出来。
1# 读取文本内容2with open('HL.txt','r',encoding="UTF-8") as f:3 file = f.read() #将文本读取为整个字符串,readlines可以按行读取
紧接着,咱们需要把读取的整个字符串分成一个个的词,jieba出征,寸草不生。
1#进行分词2data_cut =jieba.cut(file,cut_all = False)