什么是爬虫?
就是抓取网页数据的程序
爬虫怎么抓取网页数据?
网页三大特征:
- 网页都有自己唯一的URL。
- 网页都是HTML来描述页面信息。
- 网页都使用http/https协议来传输HTML数据。
爬虫的设计思路:
1、获取视频ID
2、拼接完整url
3、获取视频播放地址
4、下载视频
模块使用
requests
安装“pip install requests”
Requests库的七个主要方法
找到单个视频播放地址
获取网页源代码
获取播放地址
下载视频
实现效果
就是抓取网页数据的程序
网页三大特征:
爬虫的设计思路:
1、获取视频ID
2、拼接完整url
3、获取视频播放地址
4、下载视频
模块使用
requests
安装“pip install requests”
Requests库的七个主要方法
找到单个视频播放地址