java 解析html优化_Java HTML 解析器 jsoup 发布 1.13.1,解析速度显著提升

7efd91d557d792f9911670720eed4994.png

jsoup 1.13.1已发布,值得关注的改进包括:解析速度较1.12.x有了显著提升、选择器增加新特性、修复Mark Invalid出现异常的问题,以及许多其他的改进。

jsoup是最好的Java HTML解析器(红薯认证),它使用最好的HTML5 DOM方法和CSS选择器,为提取和处理数据提供了非常方便的API。感受一下代码:

Document doc = Jsoup.connect("https://en.wikipedia.org/").get();

log(doc.title());

Elements newsHeadlines = doc.select("#mp-itn b a");

for (Element headline : newsHeadlines) {

log("%s\n\t%s",

headline.attr("title"),

headline.absUrl("href"));

}

上面这段代码先是抓取了维基百科的主页,将其解析为DOM,然后选中“In the

ews”版块的标题并将其填充至使用Elements类初始化的headline对象中。(在线示例,完整代码)

下载地址:https://jsoup.org/download

org.jsoup

jsoup

1.13.1

1.13.1值得关注的改进

新增Element.closest()方法,它会对树进行搜索,以找到与选择器匹配的最相近元素

优化内存,将Document的常驻内存减少了约39%,分配到的内存减少了约9%

1.仅当元素具有属性时,才会在Element中创建Attributes holder

2.仅当通过DOM将给定树的baseUri设置为新值时,才跟踪该元素中的baseUri

3.完成解析后,不会在Document.parser中保留输入字符读取器(和相关的缓冲区)

与1.12.x相比,解析速度有了实质性的改进

移除旧版本中被标记为不推荐使用的旧方法和类

增加Element.select(Evaluator)和Element.selectFirst(Evaluator)方法,允许在多次使用同一评估器的情况下重用已解析的CSS选择器

详细更新内容查看https://jsoup.org/news/release-1.13.1

IT行业的发展,不仅仅是后端的编程开发,更需要有体验式的前端作支撑。后端的技术过硬了,前端的交互、美感提升了,这样的产品才会受到大众的喜爱。后端开发涉及HTML、js、CSS等,想学习web前端技术,就到太原web前端培训,选择达内更放心。

【免责声明】本文系本网编辑部分转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与管理员联系,我们会予以更改或删除相关文章,以保证您的权益!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值