分享一个非常棒的xpath教程

不多说,直接上地址: http://zvon.org/xxl/XPathTutorial/General/examples.html

点击左上角“中文”即可显示中文翻译实例。

xpath用于解析html,xml.xhtml这一类标签文档很方便,也很直接,用简短的语法提取标签文档的内容、属性等。

在linux下终端可以用xpath, xmllint --xpath这一类的工具来即时测试xpath语法提取效果。

一个简易的范例,从cnBeta获取首页热门新闻的标题和摘要

curl -s http://www.cnbeta.com | xmllint --html --xpath '/html/body/div/section/section/section/div/div/div[@id="hot"]/dl/dt/a' - 2>/dev/null
<a href="/articles/321967.htm" target="_blank">LG将推出圆形智能手表与摩托360竞争</a><a href="/articles/321965.htm" target="_blank">小米回应电量虚标问题 称质检总局抽样系非官方渠道购买</a><a href="/articles/321985.htm" target="_blank">充电宝冒烟 北京地铁15号线一列车清车</a>

最后xpath改为a/text()即可获取a标签内文本内容

转载于:https://my.oschina.net/abcfy2/blog/306383

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值