id97下电影
我们本次要爬取的网站:http://www.id97.com/movie
1、打开终端:scrapy startproject movieprject
2、scrapy genspider movie
形成的目录结构如下:
第19行:
USER_AGENT = 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.181 Safari/537.36'
第22行:
ROBOTSTXT_OBEY = False
第67-69行:
ITEM_PIPELINES = {
'movieproject.pipelines.MovieprojectPipeline': 300,
}
4、items数据
获取第一个页面的数据:
海报
名字 <