xpath提取
在 XPath 中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档(根)节点(nodename/tag)。
/ 根结点
// 任意节点
. 当前节点
… 当前节点的父节点
@ 选取属性
| 连接两个路径表达式 只要符合其中一个就选出来
css提取
#idname id选择器
.classname 类选择器
tagname 标签选择器
span::text span文本内容或者直接span.text
css(‘a::attr(href)’).getall()
css(‘a’).attrib[‘href’]
css(‘a’)[0].get(‘href’) 提取a标签中的href 属性值