java 解析html 链接_java – 如何使用JSoup解析HTML文档以获取链接列表?

< ul>包含城市是< div class =“state_delimiter”>的下一个兄弟.您可以使用

Element#nextElementSibling()从该div中获取它.这是一个启动示例:

Document document = Jsoup.connect("http://www.craigslist.org/about/sites").get();

Elements countries = document.select("div.colmask");

for (Element country : countries) {

System.out.println("Country: " + country.select("h1.continent_header").text());

Elements states = country.select("div.state_delimiter");

for (Element state : states) {

System.out.println("\tState: " + state.text());

Elements cities = state.nextElementSibling().select("li");

for (Element city : cities) {

System.out.println("\t\tCity: " + city.text());

}

}

}

doc.select(“div.state_delimiter,ul”)没有做你想要的.它返回所有< div class =“state_delimiter”>和< ul>文件的要素.如果您已经掌握了HTML解析器,那么通过字符串函数手动解析它是没有意义的.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值