关于xpath、pyquery和beautifulsoup的一点区别—xpath可以根据文本定位到节点
#根据两个标签间文字定位节点
在使用xpath之前要导入lxml的etree模块,格式是:html = etree.HTML(response.text) 格式化后,得到可以进行xpath处理的文档。
于是,进行搜索,比如搜索含有文字为:“hello”的a节点,可以使用:
result = html.xpath('//a[contains(text(), "hello")]')
#根据属性定位节点
这可以类比属性,加强记忆:如搜索属性为as的a节点:
result1 =html.xpath('//a[contains(@class, "as")]')
而对于pyquery和beautifulsoup没有这种文本标记的功能。就当个小笔记。