爬虫技术处理视频

语言:python

目的:通过url直接对某一视频进行定向爬取

所需库:requests,lxml,re,os

问题分析:随便打开一个某站视频,点击播放,你发现其就是一个局部动态加载,考虑一手ajex情况,谷歌浏览器F12,打开谷歌自带的调试工具,在网络模块打开xhr/fetch模块

按时间顺序查包看其响应,发现前两个包很特殊,响应式二进制文件,正好所需视频都是以二进制文件存在,分别编写程序对其URL发送请求,保存其响应,你可以发现,这两个响应一个对应视频文件,一个对应音频文件。

那么到这我们所需的内容已经找到了,但是这和我们的初衷不符合,我们的初衷是通过B站的URL直接保存视频,明显这个两个url和我们的目标url不一致且无明显关系,网站一定会把目标视频音频的url放回到我们的响应中或者网页原码中,复制目标视频的url,CTRL+F在网页原码搜索,你会惊奇的发现

原来目标

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

How to Learn

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值