选取div[@class=“author clearfix”]节点的同级节点的第一个a标签
div[@class=“author clearfix”]/following-sibling::a[1]
选取当前节点下所有文本内容
content = site.xpath(‘string(./div[@class=“content”]/span)’)
也可以参照这个http://www.bubuko.com/infodetail-2428621.html
XPATH如何选择不包含某一个属性的节点?
我们知道选择包含某一特定属性的节点,可以使用例如//tbody/tr[@class]来选择。那么不含某属性的节点如何用xpath取得呢?
这里可以用到not。例如排除一个属性的节点可以使用//tbody/tr[not(@class)]来写,排除一个或者两个属性可以使用//tbody/tr[not(@class or @id)]来选择。
选取当前结点的兄弟节点
//div[@class=‘box_pic’]/following-sibling::p[1]
选取了class='box_pic’的div的后面的兄弟节点中的第一个p
选取最前面的两个属于bookstore元素的子元素的book元素。
/bookstore/book[position()❤️]
选取id=pcontent的div 下的 文字 和 id=pcontent的div下的 a标签下的所有文字
//div[@id=‘p_content’][./text() and ./a//text()]
xpath模糊匹配,选取class中带有time的span标签的内容
//span[contains(@class,‘time’)]/text()