- xpath常用语法
BigNode/Node[last()] //取出BigNode路径下最后一个Node节点
Node[not(@class)] //不含class属性的node节点
Node[contains(text(),a)] //文本包含字符串a的node节点
Node[count(span)=2] //包含两个span节点的node节点
Node.xpath('string(.)')//提取出Node节点下除去标签的所有文本
- selector中extract()提取出的是list类型,extract_first()提取出的是unicode类型