前言
一个月前曾学习过爬取腾讯动漫全站的示例代码,现在再用scrapy尝试
过程
新建spider爬虫
编写普通selenium爬虫爬取漫画
观察网页,确定目标
本次目标是爬取热门排行下的漫画
右键检查可以发现漫画标题和链接可以轻松获取(前提是用selenium)
爬取内容
主要目的是为了练习scrapy的selenium,方便起见,只爬取第一部漫画`的少量信息
from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
import time
dr