python爬取小视频-今天给大家带来了python抓取b站小视频的小爬虫

最新推荐文章于 2024-05-24 16:30:33 发布

编程大乐趣

最新推荐文章于 2024-05-24 16:30:33 发布

阅读量167

点赞数

e8ca054c7f7d

首先打开小视频的网页

url = http://vc.bilibili.com/p/eden/rank#/?tab=%E5%85%A8%E9%83%A8

然后我们来分析下url：

e8ca054c7f7d

点击排行榜，默认全部显示，往下拉滚动条，发现网页是动态加载的，然后我们打开审查元素（快捷键F12），这里我用的是火狐浏览器，先清空然后往下拉进度条，就出来了动态加载的所有信息：

e8ca054c7f7d

找到下图所示的内容

e8ca054c7f7d

这个就是动态加载的内容，我们点击它，看下它有些什么东西

e8ca054c7f7d

响应里面，可以看到是json格式保存的内容，包括视频的简介，视频url等等，而这些就是我们今天的目标了！

我们先来获取消息头里面的真实网址！

e8ca054c7f7d

观察规律找到翻页的控制参数和请求模式，next_offset=后面控制视频的加载，以10的倍数翻页，请求模式为get

我们可以开始写代码了！

首先导入模块，我们今天要用到的模块很少

import requests, time, random,re

这几个模块都可以用pip来安装，cmd下输入命令:pip install 库名

其中用time和random模块是用于爬取内容时的时间间隔，re模块是用于修正文件名的函数

好了，先写个获取源码的函数

e8ca054c7f7d

头部信息在消息头里面的请求头，大家自行修改为自己的就好！

我们要依次保存mp4格式的视频文件，这里提供给大家一个小函数，用于剔除文件名中的不规范符号，用了re模块！

e8ca054c7f7d

这里说明下，这段代码是在网上找的，懒的敲了

先来获取每次加载的url，注意第一次加载的url和后面加载的不一致，用if函数。

分析整个页面发现，排行榜只有100个视频，10个一批加载，所以直接写入循环，然后用json方式获取我们需要的内容即可，非常简单的一个爬虫。

完整代码和运行结果奉上！

e8ca054c7f7d

e8ca054c7f7d

需要注意的是在下载视频文件的时候，需要加入头部信息，不然下载不了的！

e8ca054c7f7d

欢迎大家来我的python交流、学习群：542110741，大家一起学习进步！

喜欢就点个赞呗！

编程大乐趣

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python爬取小视频-今天给大家带来了python抓取b站小视频的小爬虫

首先打开小视频的网页url = http://vc.bilibili.com/p/eden/rank#/?tab=%E5%85%A8%E9%83%A8然后我们来分析下url：点击排行榜，默认全部显示，往下拉滚动条，发现网页是动态加载的，然后我们打开审查元素（快捷键F12），这里我用的是火狐浏览器，先清空然后往下拉进度条，就出来了动态加载的所有信息：找到下图所示的内容这个就是动态加载的内容，我们点...
复制链接

扫一扫

编程大乐趣

博客等级

码龄11年

24
原创

1754
点赞

1万+
收藏

2072
粉丝

关注

私信

热门文章

最新评论

用python怎样做学生管理系统用类的形式-Python配置管理的几种方式
CSDN-Ada助手: 非常感谢CSDN博主的分享，这篇博客内容丰富，介绍了用python实现学生管理系统用类的形式和Python配置管理的几种方式。我觉得可以继续深入探讨Python配置管理的相关知识，比如如何使用配置文件、环境变量等方式来管理应用程序的配置信息。这样的技术文章对其他用户也会非常有帮助。下一篇博客建议可以写关于Python配置管理的具体实现方法和技巧，相信会有更多读者受益。加油！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
15个PHP关于高并发的面试题（总结）
后端木木: 开刷撒
11个程序员最常犯的MySQL错误（PHP开发）
向彪-blockchain: 博主写的非常清晰，对我很有帮助，谢谢，方便可以互相关注。共同学习~方便的话可以加个关注。共同学习！一起进步！
2020年最新的PHP面试题（附答案）
向彪-blockchain: 写的挺不错的，继续加油哦！方便的话可以加个关注。共同学习！一起进步！
2020年，为什么你该学PHP？！！
向彪-blockchain: 比较简单，适合小白。方便的话可以加个关注。共同学习！一起进步！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。