使用jsoup解析html页面

1、运用Jsoup删除HTML中指定元素的标签

删除指定的DIV或其他标签元素的class或id,当删除属性class与id时所运用的方法相同,他们的区别在于class运用的是 “.” 而id运用的是“#”这里跟jQuery里面获取控制HTML标签的方法类似相同。这里运用删除DIV中的id为tlink_m和p中class为search为例。具体代码如下:

Document doc = Jsoup.connect(url).data("jquery","java").userAgent("Mozilla").cookie("auth", "tiken").timeout(5000).get();
			doc.select("div#tlink_m").remove();
			doc.select("p.search").remove();


2 、使用选择器语法来查找标签元素

说明:由于jsoup与jquery有类似的语法,可以运用其类似jquery的语法进行查找和操作标签元素

具体方法:Element.select(String selector) 或 Elements.select(String select)

由于select方法在Document和Element以及Elements对象中多可以使用,并且它返回的是一个Elements集合

对于Selector选择器的说明:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值