欢迎点击右上角关注小编,除了分享技术文章之外还有很多福利,私信学习资料可以领取包括不限于Python实战演练、大航海计划、BAT内推、学习资料等。
现在B站上面有很多的Python学习视频,但是如果你想下载视频来应该怎么做?
今天咱们就来爬取下载b站视频,话不多说,说干就干。
Python爬虫基本思路
爬虫:请求网站并提取数据的自动化程序。
流程: 发送请求 -> 获取数据 -> 解析数据 -> 存储数据
基本环境配置
Python3.6
Windows10
模块:
分析网页源码
按f12浏览器开发者工具 ,通过一番审查,我们定位到视频的url在网页源代码的位置如下:
如果在浏览器中查找不方便的话,我们可以把通过代码把网页源码输出到本地
为了伪装成浏览器,我们需要在reqests添加Headers,这个Headers需要我们去浏览器中手动获取,切换到NetWork标签下,再选择Headers。
得到了网页的源码,并在源码中定位到了视频地址,接下来,我们就用代码自动获取这个地址了
下载视频
把它的Headers添加到reqests中,就可以下载视频了
with open(filename, "wb") as f:
f.write(requests.get(url=url, headers=self.downloadVideoHeaders, stream=True, verify=False).content)
复制代码