css选择器
response.css('标签名'),标签名的话可以是html标签比如:title、body、div,也可以是你自定义的class标签。
例子
response.css('title')
##.extract() 对结果以列表的形式进行返回
##.extract_first() 对extract()返回的结果列表取第一个元素。
response.css('title').extract()
response.css('title').extract_first()
##::text以文本的方式提取
response.css('title::text').extract_first()
是使用调试命令"scrapy shell www.baidu.com进行调试
使用css选择器爬取 百度标题首页
使用extract(),可以看到是以列表的形式返回
使用“::text",看到以文本的方式返回标题