xpath无法获取值、返回值为[]或者{}的问题解决

最近用xpath,刚开始有很多问题

用测试代码跑的时候经常获取不到值。

第一种情况:


page= etree.parse('text.html')  #text.html为一个html文件
<class 'lxml.etree._ElementTree'>
 
  
page = etree.HTML(html)          #heml为一个字符串
<class 'lxml.etree._Element'>

    一开始通过使用字符串进行解析,通过page.xpath()进行元素获取,找不到值,后面发现这个type是“lxml.etree._Element” ,而不是“lxml.etree._ElementTree”

    获取所有元素的时候两个都行,但是通过id或者class获取时下面的那个获取不到。使用第一种就行。

第二种情况:

/     从根节点选取。
//    从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。
这两个符号是官网解释。

下面是我的代码 html.xpath(
'/div[contains(@id,"test")]') html.xpath('//div[contains(@id,"test")]') 发现第一个中不到元素,第二个可以。

 

附上html代码:

<?xml version="1.0" encoding="ISO-8859-1"?>
<bookstore>
        <book class="ook">
                    book1111
                  <title lang="eng">Harry Potter</title>
                  <price id='11'>29.99</price>
        </book>
        <book  class="ook">
                    book2222
                  <title lang="eng">Learning XML</title>
                  <price>39.95</price>
        </book>
        <div id="test" class="rr"><title id="eng">Learning XML</title>
        </div>
</bookstore>

 

目前存在这些问题体,后面遇到再加。

 

转载于:https://www.cnblogs.com/51python/p/10553264.html

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值