Selectors选择器
Scrapy Selectors 内置 XPath 和 CSS Selector
Selector有四个基本的方法,最常用的还是xpath:
- xpath(): 传入xpath表达式,返回该表达式所对应的所有节点的selector list列表
- extract(): 序列化该节点为Unicode字符串并返回list, extract_first()
- css(): 传入CSS表达式,返回该表达式所对应的所有节点的selector list列表,语法同 BeautifulSoup4中soup.select()
- re(): 根据传入的正则表达式对数据进行提取,返回Unicode字符串list列表