爬取网易云音乐个人动态中的视频(Ⅰ): 分析

最新推荐文章于 2022-03-20 23:16:44 发布

鱼小辉

最新推荐文章于 2022-03-20 23:16:44 发布

阅读量1.3k

点赞数

分类专栏：爬虫 python 文章标签：网易云

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/YJH799813708/article/details/80802630

版权

爬虫同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

前言

在某天下午, 我愉快的刷着云村哈哈, 很欢乐, 无意看到我所关注的一位音乐人说要下架他(她)所创作的所有电台, 我想着会不会以后动态里的视频也要删除呢? 刚好很久没有写过爬虫的代码了, 于是就有了这样的事儿.

简单分析

因为是要将视频爬取下来, 而且粗略估计一个视频的时长大概5分钟不到, 网易云应该不会对视频进行分段, 所以最终的目标就是获取视频的链接.

按照一些爬虫教程所说, 思路大概可以这么概括: 观察网页的元素, 获取视频关键的id等信息, 分析网络请求(get或post一些什么信息), 对返回的信息进行一些存储的操作. 然而, 网易云音乐的网站基本是用<iframe>这个标签构建的, 简单的爬虫对其并不友好, 那么我们用selenium+phantomjs来解决这个问题就好了.

以个人动态页面为例, 通过对其的分析, 可以看出html标签中的自定义属性data-vid存放了视频的id, 如下图

在新的页面打开视频, 可以看到地址栏的地址应为

http://music.163.com/#/video?id=5B0AF067CBB42F7789F7B97E13827565

通过播放视频, 分析网络请求, 可以看出这个视频是通过网易云自己的api来获取

这个 playurl?crsf_token= 看起来和我需要的东西有关系, 仔细瞧一瞧, 可以发现Request URL为 http://music.163.com/weapi/cloudvideo/playurl?csrf_token=

再来看看参数什么的

从上图的红框和Request URL可以推测这个是网易云的api

再来看看Response

上图的红框中的url就是视频的url, 而且还是超清(shd).

小结

最终思路是这样的:

用selenium+phantomjs在个人动态页面上获取所有的视频id(data-vid)
使用api去获取视频链接
保存链接等

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
爬取网易云音乐个人动态中的视频(Ⅰ): 分析

前言在某天下午, 我愉快的刷着云村哈哈, 很欢乐, 无意看到我所关注的一位音乐人说要下架他(她)所创作的所有电台, 我想着会不会以后动态里的视频也要删除呢? 刚好很久没有写过爬虫的代码了, 于是就有了这样的事儿. 简单分析因为是要将视频爬取下来, 而且粗略估计一个视频的时长大概5分钟不到, 网易云应该不会对视频进行分段, 所以最终的目标就是获取视频的链接.按照一些爬虫教程所说, 思路大概可以这么概...
复制链接

扫一扫

专栏目录

鱼小辉 CSDN认证博客专家 CSDN认证企业博客

码龄12年

3: 原创

65万+: 周排名

228万+: 总排名

6219: 访问

: 等级

102: 积分

1: 粉丝

2: 获赞

5: 评论

7: 收藏

私信

关注

热门文章

分类专栏

爬虫 3篇
python 2篇

最新评论

爬取网易云音乐个人动态中的视频(Ⅲ): 实现爬取过程
weixin_45190520: 同样看不懂
爬取网易云音乐个人动态中的视频(Ⅰ): 分析
weixin_45190520: 那个加密参数
爬取网易云音乐个人动态中的视频(Ⅲ): 实现爬取过程
杨葱葱葱: 有java版本的吗
爬取网易云音乐个人动态中的视频(Ⅱ): 分析并获取api
小z的笔记本回复 miaogoujie: 我和你一样啊兄弟，找bug一整天了。最后发现是参数顺序的原因。详见https://www.cnblogs.com/zhuchunyu/p/10778427.html
爬取网易云音乐个人动态中的视频(Ⅱ): 分析并获取api
miaogoujie: 大佬写的很详细我也照着做了。2019年9月1日分析连接：https://music.163.com/#/video?id=5339DBD929C8417DA53FC0AFBD83E35F 断点行数和你的有差别12896行。参数和你的一样。但是最后做到的返回值确是{"code":400}。但是同页面https://music.163.com/weapi/cloudvideo/playurl?csrf_token= 这个连接是可以返回没问题的。按道理算法是没问题的。请问哪里存在问题呢？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。