这篇博客补充一下 scrapy
选择器相关知识。
scrapy 选择器
scrapy 框架自带数据提取机制,相关内容被称为选择器 seletors
,其通过 XPath
,CSS
表达式可以选择 HTML 中的指定部分。
scrapy
选择器是基于 parsel
库实现的,该库也是一个解析库,底层使用的是 lxml
,所以它的用法和效率都接近 lxml
,在《爬虫 120 例》专栏后续部分,会针对性的补充一下该库相关知识点。
selectors 基本使用
本次学习过程中,使用 CSDN 的 专栏排行榜 进行测试。
选择器对象,可以直接通过 response 对象调用
import scrapy
class CSpider