Scrapy获取网易云音乐歌手全部歌曲(excel存取)

最新推荐文章于 2020-11-28 04:44:16 发布

置顶

丶先森

最新推荐文章于 2020-11-28 04:44:16 发布

阅读量2.8k

点赞数 4

CC 4.0 BY-SA版权

分类专栏：爬虫

本文链接：https://blog.csdn.net/qq_34826781/article/details/79330732

该博客介绍了如何使用Scrapy爬虫框架来获取网易云音乐中特定歌手（以林俊杰为例）的所有歌曲信息，包括歌名、歌手和所属专辑，并以Excel格式存储。博主详细讲解了从获取歌手专辑页面、专辑ID、歌曲ID到最终爬取歌曲详情的整个过程，并分享了如何实现翻页和解析网页源码的技巧。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言:

这个爬虫是为了之后爬取10W以上评论的歌曲做一下准备，这次以网易云音乐中的林俊杰为实验例子

爬虫思路:

爬取思路上，需要先通过歌手的所有专辑页面，获取到歌手的每个专辑的id，通过专辑的id转到专辑的界面，在专辑中获取歌曲id，转到歌曲界面后，我们就可以抓取歌曲上的信息了，不包括评论数，评论数是在另外的页面

爬虫过程:

首先展示一下爬虫的item部分

class WangyimusictestItem(scrapy.Item):
    # define the fields for your item here like:
    # name = scrapy.Field()
    singer = scrapy.Field()#歌手
    music = scrapy.Field()#歌曲
    cd = scrapy.Field()

在Item部分中，我的目标只是获取歌曲的歌名，歌手和歌曲所在的专辑

在主爬虫部分，我们首先需要解析网页

这个是林俊杰的界面，右键查看源代码发现并没有专辑内容

但是发现右键会有一个“查看框架源代码”的选项，发现在这里面可以查看到我们需要内容

这里面正是存放着我们需要爬取的专辑，那么这个网页到底在哪里呢，我们可以F12查看审查元素，在Network中我们发现了我们需要的内容

最低0.47元/天解锁文章

200万优质内容无限畅学