python网络爬虫网易云音乐guihub_GitHub - GreatV/CloudMusic-Crawler: 网易云音乐爬虫,数据可视化。...

本文介绍了使用Python爬虫抓取并分析网易云音乐歌词的过程,包括歌词的收集、文本分析和词云可视化。通过爬虫获取约26000行歌词,并对特定歌手进行词频分析,生成词云图和饼状图。后续计划进行情绪分析,探索评论的情感色彩。
摘要由CSDN通过智能技术生成

新版即将到来。。。

Introduction

看见有人写了一篇我用Python分析了42万字的歌词,为了搞清楚民谣歌手们在唱些什么,觉得挺好玩的,于是就想自己也实现一下。于是本作品就诞生了。

爬虫

爬虫部分主要是调用已有的 API。这部分的工作可以参考NetEase-MusicBox,该作品作者实现了网易云音乐的命令行版,我用了一下还不错。主要参考了该作者的api.py部分。

文件处理

该部分主要的工作是将所有歌词写入一个文件,同时每个作者的所有歌词也放入一个文件,以备后面的分析之用。

本次获取的歌词大概 26000 行。

文本分析

我首先选取了一位歌手作为代表分析了一下词频,如下所示:

做了一个词云:

然后。把所有的歌词都分析了一下,得到了如下饼状图:

还做了一个词云,如下所示:

接下来的工作

情绪分析

云音乐的评论很精彩,可以做一下评论,看看有什么发现

如何使用

git clone https://github.com/GreatV/CloudMusic-Crawler.git

cd CloudMusic-Crawler

python3 -m venv venv

source venv/bin/activate

pip install -r requirements.txt

cd NEMCrawler

python NEM_spider.py

python text_mining.py

firefox render.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值