jsoup 1.13.1已发布,值得关注的改进包括:解析速度较1.12.x有了显著提升、选择器增加新特性、修复Mark Invalid出现异常的问题,以及许多其他的改进。
jsoup是最好的Java HTML解析器(红薯认证),它使用最好的HTML5 DOM方法和CSS选择器,为提取和处理数据提供了非常方便的API。感受一下代码:
Document doc = Jsoup.connect("https://en.wikipedia.org/").get();
log(doc.title());
Elements newsHeadlines = doc.select("#mp-itn b a");
for (Element headline : newsHeadlines) {
log("%s\n\t%s",
headline.attr("title"),
headline.absUrl("href"));
}
上面这段代码先是抓取了维基百科的主页,将其解析为DOM,然后选中“In the
ews”版块的标题并将其填充至使用Elements类初始化的headline对象中。(在线示例,完整代码)
下载地址:https://jsoup.org/download
org.jsoup
jsoup
1.13.1
1.13.1值得关注的改进
新增Element.closest()方法,它会对树进行搜索,以找到与选择器匹配的最相近元素
优化内存,将Document的常驻内存减少了约39%,分配到的内存减少了约9%
1.仅当元素具有属性时,才会在Element中创建Attributes holder
2.仅当通过DOM将给定树的baseUri设置为新值时,才跟踪该元素中的baseUri
3.完成解析后,不会在Document.parser中保留输入字符读取器(和相关的缓冲区)
与1.12.x相比,解析速度有了实质性的改进
移除旧版本中被标记为不推荐使用的旧方法和类
增加Element.select(Evaluator)和Element.selectFirst(Evaluator)方法,允许在多次使用同一评估器的情况下重用已解析的CSS选择器
详细更新内容查看https://jsoup.org/news/release-1.13.1
IT行业的发展,不仅仅是后端的编程开发,更需要有体验式的前端作支撑。后端的技术过硬了,前端的交互、美感提升了,这样的产品才会受到大众的喜爱。后端开发涉及HTML、js、CSS等,想学习web前端技术,就到太原web前端培训,选择达内更放心。
【免责声明】本文系本网编辑部分转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与管理员联系,我们会予以更改或删除相关文章,以保证您的权益!