Java爬虫之学习篇 Jsoup使用的进阶篇

1、abs的使用

String domainUrl ="https://mbd.baidu.com";
String text ="<a href=\"/newspage/data/landingsuper?context=%7B%22nid%22%3A%22news_9661205985154582205%22%7D&amp;n_type=0&amp;p_from=1\" title=\"TL教练或顶替打野位!网友:主教练Clearlove正在热身\" </a>";

//之前的解法
Element ele= Jsonp.parse(text);
String url = domainUrl +ele.attr("href");

//使用 abs
Element ele= Jsonp.parse(text,domainUrl );
String url = ele.abs("href");

2、contains

<div class="grid-x">
<div class="cell small-12 medium-3">
<b>Type</b>
</div>
<div class="cell small-12 medium-9">
<h2>水槽水龙头</h2>
</div>
</div>


 doc.select("div.cell.small-12.medium-3:contains(Type)");

3、hasattr

4、ownText()

5、not

引用:https://www.cnblogs.com/jerrychen/p/4667309.html

String html = "<p>An <a href='http://example.com/'><b>example</b></a> link. this is other <a href="http://example.com/abc" style="color:red">linkB</a></p>";
Document doc = Jsoup.parse(html);
Elements links = doc.select("a");
for(Element e : links)
{
   String linkHref = link.attr("href"); 
   ...
}
Element link = doc.select("a").first();

//
Element example = doc.select("a").not("[style]").first();

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值