有用的XPath表达式

$x('//p')
$x('//a')
$x('//div//a')
$x('//a/@href')
$x('//a/text()')

第一个 选择所有元素

第二个 选择所有链接

第三个 访问链接中的href

第五个 文本

$x('//div/*')

访问所有元素

$x('//a[contains(@href,"iana")]')
$x('//a[starts-with(@href,"http://wwww.")]')
$x('//a[not(contains(@href,"abc"))]')

高级应用

//*[contains(@class,"ltr") and contains(@class,"skin-vector")]//h1//text()

class属性包含ltr 和 skinector的元素

//div[@id="toc"]/ul//a/@href

获取id为 toc的div标签内的无需列表(ul)中的所有链接的url

//table[@class="infobox"]//img[1]/@src

选择table属性之为“infobox”的表格中第一章图片的url 

//div[starts-with(@class,"reflist")]//a/@href
//*[text()="References"]/../following-sibling::div//a

选择子元素包含文本 refer 的元素之后的div元素中所有链接的url

//img/@src

获取页面中每张图片的URL

 

 

 

 

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值