- 设定没选择到时的默认返回字段
>>> response.xpath('//div[@id="not-exists"]/text()').extract_first(default='not-found')
'not-found'
./
和.//
的差别
#./选择的是 CLASS=quote的div下的符合条件的子元素(只包括子元素)。而.//选择的是div下的所有符合条件的元素。不管是子元素还是子子元素还是子子子元素
quote = response.xpath('//div[@class="quote"]')
quote.xpath('./span[@class="text"]/text()').
quote.xpath('.//small[@class="author"]/text()').extract_first(),