JSoup 代码总结

常用的html解析器有jsoup、htmlparser等。

File  input=new File("xxx.html");

Document   doc=Jsoup.parse(input,"UTF-8","http://xxx");

Document   doc=Jsoup.connect("http://xxx").get();


查找元素

Element   content=doc.getElementById("id");

Element   tags=doc.getElementsByTag("tag");

getElementsByClass("classname");

getElementsByAttribute("key");


元素数据

attr(String key) 获取属性                attr(String key ,String value) 设置属性

text()  获取文本内容                        text(String  value)设置文本内容

html()  获取元素内html内容           html(String value)设置元素内的html内容

outerHtml()  获取元素外的html内容

data()    获取数据内容




解析html片段

Jsoup.parseBodyFragment(String html);



使用选择器来查找内容

select方法在document、Element或Elements对象中都可以使用。select方法返回一个Elements集合,并提供一组方法来抽取和处理结果。


URL处理

在HTML元素中,url经常写成相对于文档位置的相对路径。假如需要取得一个绝对路径,需要在属性名前加abs: 前缀。

attr("abs:href")




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值