python制作词云

本文介绍了在Linux环境下,使用Python的Anaconda、wordcloud和jieba库,爬取QQ音乐中周杰伦所有专辑的歌词,生成词云图片的过程。通过F12找到数据接口,正则获取JSON数据,清洗并分词,最终在本地生成词云。注意wordcloud需导入中文词库以正确显示中文。
摘要由CSDN通过智能技术生成

  “词云”又叫文字云,是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的无意义信息,使浏览者只要一眼扫过词云图片就可以领略文章或者网页内容的主要表达意思。

  我的制作过程:

我是在Linux环境里开发的,使用的是python开源库Anaconda,所以只要pip安装wordcloud和jieba就可以了

pip install wordcloud
pip install jieba

之后就开始敲代码了,

python爬取QQ音乐(网易云需要API,我还没爬过)某个歌手的全部专辑歌词并生成词云图片,最近因为想做一个py项目,由于非常喜欢周杰伦的歌,了解到python适合做词云,从而产生了用py生成歌手所有专辑的歌中的歌词的词云.

程序功能 : 获取某个歌手的QQ音乐的专辑歌曲歌词 - 生成歌词云图片

工作原理

1. F12找到数据接口,调用并且用正则获取json格式的数据.

2. 获取本地的所有歌词,清洗干净那些特殊字符,然后用jieba分词,最后通过WordCloud输出.

3. 最终在本地生成相应词云

效果图如下:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值