一:实现功能
获取(电影天堂)电影详情页链接,再获取电影名字以及下载地址,在控制台输出
二:思路
1、爬取(电影天堂)首页电影详情页所有链接,如图所示
2、查看抓取内容网页源码------看适合用那种方法抽取结果
3、将第二步抽取的链接加入请求队列中-----进行二次请求
4、获取电影的名字和下载地址-----如下图所示
5
三:代码实现
前面步骤还是如上次写的WebMagic(一):<
一:实现功能
获取(电影天堂)电影详情页链接,再获取电影名字以及下载地址,在控制台输出
二:思路
1、爬取(电影天堂)首页电影详情页所有链接,如图所示
2、查看抓取内容网页源码------看适合用那种方法抽取结果
3、将第二步抽取的链接加入请求队列中-----进行二次请求
4、获取电影的名字和下载地址-----如下图所示
5
三:代码实现
前面步骤还是如上次写的WebMagic(一):<