因为大部分信息都来自HTML,所以用户录入信息时都是以HTML语言展示为主,那么难免会有HTML需要显示的特殊字符,如果想要这些字符正确显示到doc文档中,则需要把这些字符进行转换,幸好Apache提供了支持:
import org.apache.commons.lang3.StringEscapeUtils;
import org.junit.Test;
/**
* Created by Heweipo on 2017/3/16.
*/
public class StringEscapeUtil {
/**
* HTML 转码特殊字符
*/
@Test
public void testUnEscape(){
String str = "♠ Hello world ↑";
str = StringEscapeUtils.unescapeHtml4(str);
System.out.println(str);
}
/**
* HTML 编码特殊字符
*/
@Test
public void testEscape(){
String str = "♠ Hello world ↑";
str = StringEscapeUtils.escapeHtml4(str);
System.out.println(str);
}
}