Xpath入门

入门教程:

  1. W3school之XML部分
  2. www.spbeen.com
    筆記:
    ----XPath是干什么的XPath 使用路径表达式来选取 XML 文档中的节点或者节点集。
    ----‘XPath’疑难点:
    1:参数html的开始节点是
    2:xpath的推荐开始头部分:
    #绝对定位,从头开始
    html.xpath(’/html’)
    html.xpath(‘body’)
    html.xpath(‘head’)
    html.xpath(’/html/body/table/tr/td’)
    #相对定位,从某个属性定位
    html.xpath(’//table/tr/td’)
    html.xpath(’.//table/tr/td’)------------>推荐写法
    3:写法規則:在这里插入图片描述
    在这里插入图片描述
    4:万一目标元素的命名中有前后空格的话xpath是识别不出来的,咋办呢?
    解决办法:contains的妙用
    原始方法:
    print(html.xpath('.//div[@class="three"]/text()')):
    用contains改进:
    print(html.xpath('.//div[contains(@class,"three")]/text()'))
    5:还可以在条件处用与、或、非等逻辑操作,两个中括号代表与
    6:xpath尽可能越短越好,越精简越好,不要搞得太复杂太长了,实在不行就分块写!
    7:xpath里面索引采用具体的下标值是不太稳妥的,推荐采用position()定位函数,用大小来比较位置
    8:取末位置的值:last(),父级标签的最后一个子级,也可以说是当前同级标签的最后一个
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值