xpath定位的用法 (“//标签名[ @属性= “属性值“]“)

一、xpath:属性定位    

 xpath : ("//标签名[ @属性= "属性值"]")
  1. xptah也可以通过元素的id、name、class这些属性定位,如下图

 

    2.于是可以用以下xpath方法定位

 

二、xpath:其它属性

    1.如果一个元素id、name、class属性都没有,这时候也可以通过其它属性定位到


三、xpath:标签

    1.有时候同一个属性,同名的比较多,这时候可以通过标签筛选下,定位更准一点

    2.如果不想制定标签名称,可以用*号表示任意标签

    3.如果想制定具体某个标签,就可以直接写标签名称

 

四、xpath:层级

    1.如果一个元素,它的属性不是很明显,无法直接定位到,这时候我们可以先找它老爸(父元素)

    2.找到它老爸后,再找下个层级就能定位到了

    3.如上图所示,要定位的是input这个标签,它的老爸的id=s_kw_wrap.

    4.要是它老爸的属性也不是很明显,就找它爷爷id=form

    5.于是就可以通过层级关系定位到

 

五、xpath:索引

    ​1.如果一个元素它的兄弟元素跟它的标签一样,这时候无法通过层级定位到。因为都是一个父亲生的,多胞胎兄弟。

    ​2.虽然双胞胎兄弟很难识别,但是出生是有先后的,于是可以通过它在家里的排行老几定位到。

    ​3.如下图三胞胎兄弟

 

    ​4.用xpath定位老大、老二和老三(这里索引是从1开始算起的,跟Python的索引不一样)

 

六、xpath:逻辑运算

    ​1.xpath还有一个比较强的功能,是可以多个属性逻辑运算的,可以支持与(and)、或(or)、非(not)

    ​2.一般用的比较多的是and运算,同时满足两个属性

 

 

七、xpath:模糊匹配

    ​1.xpath还有一个非常强大的功能,模糊匹配

    ​2.掌握了模糊匹配功能,基本上没有定位不到的

    ​3.比如我要定位百度页面的超链接“hao123”,在上一篇中讲过可以通过by_link,也可以通过by_partial_link,模糊匹配定位到。当然xpath也可以有同样的功能,并且更为强大。

 

使用XPath可以方便地获取HTML标签的属性值。例如,如果我们想要获取所有名称为"title",同时属性"lang"的值为"eng"的节点的属性值,可以使用以下XPath表达式://title[@lang='eng']/@属性名。其中,"属性名"是你想要获取的具体属性的名称。 如果我们想要同时匹配多个属性来确定一个节点,可以使用运算符"and"来连接多个属性条件。例如,在Python的lxml库中,可以使用以下代码获取多个属性匹配的节点属性值: from lxml import etree text = '<li class="li li-first"><a href="link.html">first item</a></li>' html = etree.HTML(text) result = html.xpath('//li[contains(@class, "li") and @name="item"]/a/@属性名') print(result) 这个代码片段将返回所有名称为"li",同时属性"class"包含"li",并且属性"name"的值为"item"的节点的属性值。你可以将"属性名"替换为你想要获取的具体属性的名称。 需要注意的是,XPath表达式中的"/@属性名"表示获取节点的某个属性值,而不是获取节点的文本内容。如果想要获取节点的文本内容,可以使用"text()"方法,例如"//li/a/text()"表示获取所有"li"标签下的"a"标签的文本内容。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [Python爬虫从入门到精通——解析库XPath的使用](https://blog.csdn.net/hy592070616/article/details/90610339)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* [xpath获取标签的属性值_解析库之Xpath,pyquery](https://blog.csdn.net/weixin_39843431/article/details/109961000)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值