==========================================================================
首先我们根据上篇文章的方法创建项目以及爬虫文件
- 创建项目
scrapy startproject dangdang
- 创建爬虫文件
scrapy genspider dangtushu url
通过xpath语法在网页中提取我们想要的数据(书名,图片,价格)
- 查找图片
src_list = response.xpath(“//div[@class=‘cover’]//a/img/@src”)
- 查找书名
name_list = response.xpath(“//div[@class=‘tushu’]//a