问题描述:
使用Jsoup.parse() 方法解析html 片段是会自动补成完整的html(加上html 、body),并且将js 脚本转换成一行,特殊符号(',",<,>,&)等转义
解决办法:
Entities.EscapeMode.base.getMap().clear(); //转义前清除jsoup 转义表
Document doc = Jsoup.parseBodyFragment(sourceData);
doc.outputSettings().prettyPrint(false);//设置document 输出属性,设置是否压缩打印为false;