使用环境:
- python3
- scrapy
- win10
爬取步骤
(1)从用户视频列表页开始
(2)使用ajax对接接口
(3)获取今日头条视频真实地址(西瓜视频真实地址)
备注:
这里的今日头条视频链接是直接跳转到365阳光宽频网的
https://www.365yg.com/
(1)我们要做的目标就是从把某个作者下的视频全部爬取下来。
(2)列表页下滑,获取xhr json数据
(3)xhr json获取规则: max_behot_time 参数的获取
(1)从用户视频列表页开始
(2)使用ajax对接接口
(3)获取今日头条视频真实地址(西瓜视频真实地址)
备注:
这里的今日头条视频链接是直接跳转到365阳光宽频网的
https://www.365yg.com/
(1)我们要做的目标就是从把某个作者下的视频全部爬取下来。
(2)列表页下滑,获取xhr json数据
(3)xhr json获取规则: max_behot_time 参数的获取