“词云”又叫文字云,是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的无意义信息,使浏览者只要一眼扫过词云图片就可以领略文章或者网页内容的主要表达意思。
我的制作过程:
我是在Linux环境里开发的,使用的是python开源库Anaconda,所以只要pip安装wordcloud和jieba就可以了
pip install wordcloud
pip install jieba
之后就开始敲代码了,
python爬取QQ音乐(网易云需要API,我还没爬过)某个歌手的全部专辑歌词并生成词云图片,最近因为想做一个py项目,由于非常喜欢周杰伦的歌,了解到python适合做词云,从而产生了用py生成歌手所有专辑的歌中的歌词的词云.
程序功能 : 获取某个歌手的QQ音乐的专辑歌曲歌词 - 生成歌词云图片
工作原理
1. F12找到数据接口,调用并且用正则获取json格式的数据.
2. 获取本地的所有歌词,清洗干净那些特殊字符,然后用jieba分词,最后通过WordCloud输出.
3. 最终在本地生成相应词云
效果图如下: