jsoup 包解析html

这两天碰到需要请求别人网站接口,然后接口返回来的是一个html的网页形式,所以需要解析网页,所以选择用jsoup来解析,这是一个挺好用的工具包吧,反正看了挺多人用的,先贴代码吧。

我这里用的不多的,我是自己用httpclient请求得到数据,然后再用jsoup解析,不过也可以直接用jsoup去请求,直接得到解析对象,不过jsoup底层也是用Httpclient先请求的,没差

     resultString = HttpClientUtil.doGet(ticketUrl, cookie); //请求得到字符串形式的返回体,这里是html的字符串
     Document document = Jsoup.parse(resultString); //然后用Jsoup将字符串转换为doucument,这其实跟解析xml差不多吧。
     String ticket = document.getElementById("autopost").getElementsByTag("input").val(); //这里先用getElementById拿到标签id是autopost的节点,然后通过byTag拿到标签,再val()拿到这个标签的值,

 

Elements elements = document.getElementsByTag("script");
String[] varList = elements.get(3).data().toString().split("var");

这里也一样,这是拿script的值,通过标签拿所以的script节点,然后get(3)拿到第四个script节点,再拿里面的值

 

暂时用的是这些,就是先转换为解析对象,Doucement再一步步解析,方法很多,通过id拿,通过标签拿,通过class拿节点等等,不过jsoup有一个好处就是,他能自动给你补html格式,详细我看了一个文章,

链接:https://www.cnblogs.com/jycboy/p/jsoupdoc.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值