做了一段时间的网页解析的工作,有了些体会,写出来和大家分享。 import java.io.BufferedReader; import org.cyberneko.html.parsers.DOMParser;
除了提供DOM接口外,nekohtml还有一些其他功能,如格式化网页文本、确保网页格式良好(well-formed)等,具体可参见nekohtml的文档。 |
nekohtml的简单使用
最新推荐文章于 2021-02-19 08:38:03 发布
做了一段时间的网页解析的工作,有了些体会,写出来和大家分享。 import java.io.BufferedReader; import org.cyberneko.html.parsers.DOMParser;
除了提供DOM接口外,nekohtml还有一些其他功能,如格式化网页文本、确保网页格式良好(well-formed)等,具体可参见nekohtml的文档。 |