问题背景
目的是将该名人名言网站的作者、标签以及文本信息爬取下来。
实现过程
一、调出cmd窗口
cd /d 所要保存的路径
#q2为新建的文件名
scrapy startproject q2
cd q2
scrapy genspider q2q quotes.toscrape.com
#接下来可直接在cmd窗口中进行测试,也可以到Python编辑器里面进行测试
cd q2
scrapy shell http://quotes.toscrape.com
response.body
sel.xpath("/html/body/div/div[2]/div[1]/div[1]/span[1]/text()")
二、在PyCharm中打开q2文件
在Pycharm中进行测试
#在Pycharm下方的Terminal框中
cd /d 所要保存的路径\q2\q2
scrapy shell http://quotes.toscrape.com
response.body
sel.xpath("/html/body/div/div[2]/div[1]/div[1]/span[1]/text()")
在q2的spiders文件下打开q2q文件,补充相关代码: