xpath规则记录

//*[@class="body"]//text()[name(..)!="style" and name(..)!="script"]   提取文本时不包含script标签

substring-after(//*[@class="twid"]/text()[3],"来源:")   提取/text()[3] 中来源后面的文字,substring-before用法相同

substring-before(substring-after(.//*[@class="twid"]/text(),"/"),"/")  可以嵌套使用

concat(.//*[@class="article"]/span[2]//text()," ",.//*[@class="From"]/span[3]//text())  提取2个文本用空格拼接在一起


 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值