阿宁的爬虫之旅----xpath定位

本文介绍了网页元素的定位方法,包括通过ID、类名、属性值的starts-with和contains进行模糊匹配。例如,使用XPath `//*[@id='su']` 获取ID为'su'的元素,或使用CSS选择器 `//input[contains(@class,'bgs_btn')]` 定位含有特定类名的输入元素。此外,还讲解了如何利用text()函数进行文本内容的精确和模糊匹配。
摘要由CSDN通过智能技术生成
id 获取id的属性值
<input id="su" class="bg s_btn btnhover" value="百度一下" type="submit"/>
//*[@id='su']      获取id 的属性为'su' 的值
或
//input[contains(@class,'bg s_btn')]

starts-with 顾名思义,匹配一个属性开始位置的关键字 —模糊定位

contains 匹配一个属性值中包含的字符串 —模糊定位

<a class="lb" href="https://passport.baidu.com/v2/?login&tpl=mn&u=http%3A%2F%2Fwww.baidu.com%2F" name="tj_login" onclick="return false;">登录</a>
//a[starts-with(@name,'tj_lo')]     属性模糊定位
//a[contains(@name,'tj_lo')]     属性模糊定位

text()函数文本定位、

<a href="http://www.baidu.com">百度搜索</a>
//a[text()='百度搜索']//a[contains(text(),"搜索")]    --文本模糊定位
<a id="setf" href="//www.baidu.com/cache/sethelp/help.html" onmousedown="return ns_c({'fm':'behs','tab':'favorites','pos':0})" target="_blank">把百度设为主页</a>
//a[text()='把百度设为主页']
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值