python爬取网易云音乐付费音乐_python爬虫学习教程，爬取网易云音乐！

最新推荐文章于 2024-05-16 14:42:12 发布

weixin_39638526

最新推荐文章于 2024-05-16 14:42:12 发布

阅读量4.8k

点赞数

文章标签： python爬取网易云音乐付费音乐

运行环境

我的运行环境如下：

系统版本

Windows10。

Python版本

Python3.5，推荐使用Anaconda 这个科学计算版本，主要是因为它自带一个包管理工具，可以解决有些包安装错误的问题。去Anaconda官网，选择Python3.5版本，然后下载安装。

IDE

我使用的是PyCharm，是专门为Python开发的IDE。这是JetBrians的产品

实战

上面提到过，网易云音乐的网页跟普通的网页相比主要有两点不同：

网页是 js 动态加载的

使用了iframe框架

所以，

首先，网页请求不能使用requests库，需要使用Selenium + PhatomJS。

其次，使用Selenium + PhatomJS后，还需要针对 iframe 做特定处理。

废话不多说，看实际操作步骤：

废话不多说，看实际操作步骤：

首先打开网页 http://music.163.com

在右上角的搜索框中输入“The Beatles”，然后会有一个下拉选项，选择歌手 The Beatles (红框中的内容)。

然后看到如下页面，选择红框中的“所有专辑”，点击。

这样就会看见所有的专辑列表，以及下方的翻页按钮。

我们需要的就是所有专辑的图片、专辑名和专辑出版时间。看到这就可以构想一下爬虫的爬取逻辑了。定位到该页面，然后获取页码，然后挨个请求页面来爬取页面中的内容。

点击一下翻页按钮看看url 有没有什么规律。

点击第二页后，看到上面的地址栏！！！看到这个地址栏我都懒得翻页了。。。

limit 参数是限制一个页面加载专辑的个数

offset 参数是前面过滤多少个专辑，现在是一页12个专辑，所以第二页是offset=12，第三页offset=24，以此类推。。。

一共9页，一页12个，也不到120个。So... ... 改一下url 就不用翻页了！！

limit 参数等于120，offset 参数等于0，就搞定了！输入下面的url，看看是不是所有的专辑都加载出来了。

http://music.163.com/#/artist/album?id=101988&limit=120&offset=0

下面就开始爬虫代码了。

这里我们会用到上一篇博文中写好的几个工具方法：

'''

在学习过程中有什么不懂得可以加我的

python学习交流扣扣qun，934109170

群里有不错的学习教程、开发工具与电子书籍。

最低0.47元/天解锁文章

weixin_39638526

关注

0
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
python爬取网易云音乐付费音乐_python爬虫学习教程，爬取网易云音乐！

运行环境我的运行环境如下：系统版本Windows10。Python版本Python3.5，推荐使用Anaconda 这个科学计算版本，主要是因为它自带一个包管理工具，可以解决有些包安装错误的问题。去Anaconda官网，选择Python3.5版本，然后下载安装。IDE我使用的是PyCharm，是专门为Python开发的IDE。这是JetBrians的产品实战上面提到过，网易云音乐的网页跟普通的网页...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。