新工具收集-html解析

一款Java 用来解析HTML 文档的类库——jsoup
目前 OSChina 已经将原来的 htmlparser 删掉,并完全使用 jsoup 代替。jsoup 的设计十分精巧,只有十几个类居然具备非常强大的功能,如果用一句话来比较 jsoup 和 htmlparser,我想说的是,就好象是 jquery 和 prototype 的差别,jsoup 完全接受 jquery 的思路。
jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。

示例代码:

File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");

Element content = doc.getElementById("content");
Elements links = content.getElementsByTag("a");
for (Element link : links) {
String linkHref = link.attr("href");
String linkText = link.text();
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值