前言
爬虫实例,爬取斗鱼正能量视频封面图片,并且获得视频播放地址。
爬虫基本思路:
一、数据来源分析
1、开发者工具(抓包分析)>>>F12/鼠标右键点击检查
2、通过视频播放页面 打开开发者工具 选择network(XHR) 进行抓包分析(可以找视频的播放地址,图片下载地址)
3、找视频列表,找到每个视频的信息,包括标题、视频封面照片地址等;
4、通过对比两个 url地址区别:知道是根据视频的hashVid 来发生改变的
5、翻页爬取,是通过改变page=?来改变的
爬虫的基本思路是一样的,如果对爬虫基本思路有不清楚的可以参考我的python爬虫和数据处理的博客专栏。