1.嗅探器
嗅探器能够监视网络数据运行,对网页内容进行提取。以谷歌浏览器为例,猫抓嗅探器是谷歌浏览器比较常用嗅探器。
![3cc99b4a641211f4b10583bdd96c54fb.png](https://i-blog.csdnimg.cn/blog_migrate/a6d031353eb3f8730445b4860f128afd.jpeg)
有些视频是分段的,因此可能一个视频完整下载下来会有很多个子视频文件,我们可以进行合成得到整个视频文件。
![e15a6ca079ef98029d464aa23a0f8327.png](https://i-blog.csdnimg.cn/blog_migrate/a5a2b2a32f5ce9c3ac30f6cf6b705f7f.jpeg)
(1)猫抓嗅探器下载:
下载链接见评论区
(2)文件导入:
![a721707184fb09313d3c6ec02ea3e5d8.png](https://i-blog.csdnimg.cn/blog_migrate/3fc55b5c4f679dc93e6853a3c9fa0583.jpeg)
打开扩展程序页面的开发者模式,可以直接点击加载,也可以将对应的文件拖拽到扩展程序页面,完成安装
![278f6226898f0f0230db297ab4028ede.png](https://i-blog.csdnimg.cn/blog_migrate/a12db1d3a37ff054f1441378ab74e0c9.jpeg)
2.浏览器插件
以火狐浏览器为例,你可以下载相关的插件,进行网络资料的抓取
![253229456f4c630766c00e6a8b8ec119.png](https://i-blog.csdnimg.cn/blog_migrate/31e43b9027748d1f872169a3d0dd4cdf.jpeg)
方式一:网站搜索下载
a)浏览器搜索 Firefox add-ons
b)在网站中查找所需的浏览器拓展Video DownloadHelper 下载并启用
![ae718c2064778a0dd1d3ea2e6333e079.png](https://i-blog.csdnimg.cn/blog_migrate/d6def29a5327d63c92d08b532611b4f2.jpeg)
方式二: 按名称搜索下载
![5557640ec681d0a0df7c2b7b06447069.png](https://i-blog.csdnimg.cn/blog_migrate/6984144929359ad40ce7291122b52e44.jpeg)
3.Python-youget库下载
youget是python的一个第三方库,是一个非常优秀的网站视频下载工具。使用youget可以很轻松的下载到网络上的视频、图片及音乐。
youget库的使用:
方式一:直接下载
![d7973e2978be40891c0cbe57f6ff4e4b.png](https://i-blog.csdnimg.cn/blog_migrate/6f34a1246c7909854364a472dceba2d9.jpeg)
文件的默认保存地址为C盘的用户目录下
![1037b4fb11f1a7524e6bf7a51f33c0ed.png](https://i-blog.csdnimg.cn/blog_migrate/db761925fb2cfc71853c7f21988fb0bc.jpeg)
方式二:下载对应清晰度的视频文件
% 查看视频文件的清晰度you-get -i + 目标网页网址% 选择所需的清晰度you-get --format=对应的清晰度 + 目标网页网址
![900a33f4458795074c75f29738165527.png](https://i-blog.csdnimg.cn/blog_migrate/55360e47014cf0ec443550cb03df9ced.jpeg)
补充:
% 下载视频重命名you-get 目标网页网址 -O 文件名(不用加文件扩展名)% you-get https://v.qq.com/x/page/b081967rklt.html -O demo% 指定下载路径(两种方式都行)you-get 目标网页网址 -O 文件路径文件名(不用加文件扩展名)you-get 目标网页网址 -O 文件路径文件名(不用加文件扩展名)
youget常见错误处理
对于某些B站视频,如果我们直接复制浏览器地址栏的链接,运行结果可能会提示:
![80ac003b9580e3d5e3eeef5dc2e6c5a6.png](https://i-blog.csdnimg.cn/blog_migrate/994c2d52baea690738acbed5b6266f89.jpeg)
[这里需要一点前端的基础,利用抓包工具获取正确的视频文件的URL,可以在网络中结合请求头信息下载,你可以就将youget理解为一个爬虫]
在浏览器中按 F12(或者Fn+F12) 打开开发者工具,以火狐浏览器为例,在查看器下找到head标签,找到类似下图所示语句:
![5fff41b86d95f994bc33518f2e1cacbc.png](https://i-blog.csdnimg.cn/blog_migrate/37ebfc162c5dd41e504cb73617e8fdba.jpeg)
使用这个语句中的URL地址作为下载网址
4.利用爬虫进行抓取
网络爬虫是一种高效的信息采集器,你用它可以快速、准确地采集我们想要的各种数据资源。
示例:知乎热榜文本数据的采集并写入文件
![e3df9ef8caa0ad23a107d9f0cc1e9009.png](https://i-blog.csdnimg.cn/blog_migrate/cd77371f094ab26a420ae4f743eacb93.jpeg)
作者作为一个Python爬虫的爱好者,在后续会开设专栏,整理补充有关Python爬虫的相关文章,想要学习爬虫的小伙伴可以关注留言。