本工具可以快速清理html中不需要的标签,可以指定标签名称、属性、class,并且可以清理class的值,还可以清理标签的属性值。
指定标签规则:
tagname: 通过标签查找元素,比如:a;
#id: 通过ID查找元素,比如:#logo;
.class: 通过class名称查找元素,比如:.red;
[attribute]: 利用属性查找元素,比如:[href];
*:所有都选择。
属性值规则:
name: 属性的名称;
*:所有都选择。
1、所有标签
清除所有HTML标签,仅保留文本节点。
2、简单文本
保留b, em, i, strong, u 标签,除此之外的所有HTML标签都会被清除。
3、常用文本标签
保留 a, b, blockquote, br, cite, code, dd, dl, dt, em, i, li, ol, p, pre, q, small, span, strike, strong, sub, sup, u, ul 和其适当的属性标签,不允许出现图片(img)。超链接中可以允许其指定http, https, ftp, mailto 且在超链接中强制追加rel=nofollow属性。
4、常用包含图片
常用文本标签中允许出现的标签的同时也允许出现图片(img)和img的相关适当属性,且其src允许其指定 http 或 https。
5、简单清理
保留 a, b, blockquote, br, caption, cite, code, col, colgroup, dd, div, dl, dt, em, h1, h2, h3, h4, h5, h6, i, img, li, ol, p, pre, q, small, span, strike, strong, sub, sup, table, tbody, td, tfoot, th, thead, tr, u, ul 标签,除此之外的所有HTML标签都会被清除,且在超链接中不会强制追加rel=nofollow属性。