根据原有html,输入文字信息后保存到数据库并导出pdf可能会含有</p>,<br/>,大于小于号等标签,这些需要替换或者转义
例如,
HTML输入如下:
根据报表统计如下,共包含:
<交通费 > 1项 100元
<住宿费 > 1项 100元
<伙食费> 1项 100元
<项目费> 1项 100元
共计400元。
数据库存储如下:
<p>根据报表统计如下,共包含:<br/>
<交通费 > 1项 100元<br/>
<住宿费 > 1项 100元<br/>
<伙食费> 1项 100元<br/>
<项目费> 1项 100元<br/>
共计400元。</p>
导出时,需进行转移或替换
String content = dto.getContent();
content = null2Empty(content);
content = content.replaceAll("[\\t\\r\\n]", "").replaceAll("</p>","\r\n").replaceAll("<p>","").replaceAll("</?[^>]+>","").replaceAll("<a>\\s*|\t|\r|\n</a>","").replaceAll(" ","");
//转移大小写字符
content = StringEscapeUtils.unescapeHtml(contnet);
如此导出的文字中就与页面输入的一致