html引入html include_使用 Jsoup 解析 HTML 文本内容

最新推荐文章于 2022-06-30 16:19:11 发布

weixin_39692253

最新推荐文章于 2022-06-30 16:19:11 发布

阅读量129

点赞数

文章标签： html引入html include java解析html字符串

jsoup：Java HTML解析器。
它是一个用于处理实际 HTML 的 Java 库。它使用 HTML5 最佳 DOM 方法和 CSS 选择器，为获取 URL 以及提取和处理数据提供了非常方便的 API，在 web 开发中，可以用来解析富文本内容或者在爬虫抓取网页数据时候解析网页内容，等等都可以用到，在此记录下。

jsoup实现WHATWG HTML5规范，并将HTML解析为与现代浏览器相同的DOM。

从URL，文件或字符串中抓取并解析 HTML
使用DOM遍历或CSS选择器查找和提取数据
处理 HTML元素，属性和文本
根据安全的白名单清除用户提交的内容，以防止XSS攻击
输出整洁的HTML

官网： https://jsoup.org/

1、引入 Jsoup 依赖

                <!-- 解析HTML -->
		<dependency>
		    <groupId>org.jsoup</groupId>
		    <artifactId>jsoup</artifactId>
		    <version>1.12.1</version>
		</dependency>

2、简单使用示例

	public static void main(String[] args) {
		String text = Jsoup.parse("<p style='text-align: center;'><strong>测试Jsoup，正在测试。</strong></p>").text();
		System.out.println(text);
	}

3、输出结果

解析成功输出文本内容如下

码字不易，转载请注明出处。

weixin_39692253

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
html引入html include_使用 Jsoup 解析 HTML 文本内容

jsoup：Java HTML解析器。它是一个用于处理实际 HTML 的 Java 库。它使用 HTML5 最佳 DOM 方法和 CSS 选择器，为获取 URL 以及提取和处理数据提供了非常方便的 API，在 web 开发中，可以用来解析富文本内容或者在爬虫抓取网页数据时候解析网页内容，等等都可以用到，在此记录下。jsoup实现WHATWG HTML5规范，并将HTML解析为与现代浏览器相同的DO...
复制链接

扫一扫