前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。
作者: IvanFX 复兴计算机社团
PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取
基本步骤与准备工作
调试环境:
pycharm+python3
需要库:
- urllib.
- request
- re
(http.cookiejar 后续爬虫进场会使用到的库,本项目反爬不涉及所以可以不添加)
如果import过程显示没有上述库,可以通过文件→设置→projet interpreter中右侧点击+来添加(如果您使用anaconda或者python也可以直接运行本项目,通过cmd→pip install添加)
2.在本文中我们通过python对于在线的短视频进行爬取,下载存储。基本步骤如下(可以写注释梳理思路):
(1)分析页面URL和视频文件URL特征
(2)获取网页源代码HTML,解决反爬机制
(3)