过滤掉xml文档不识别的字符
表中字段x_contact_method内容是:7986555 986567
System.out.println(rs.getString("x_contact_method"));输出结果是:
7986555(注:此处是空白方框乱码)986567
中文输出正常。
我想用replaceAll("[\\r\\n]",",")把空白方框乱码替换掉,匹配不到这个字符,怎么匹配到这个字符?
String x_contact_method = rs.getString("x_contact_method");
System.out.println(x_contact_method);
java.util.regex.Pattern INVALID_XML_CHARS = Pattern.compile("[^\\u0009\\u000A\\u000D\\u0020-\\uD7FF\\uE000-\\uFFFD\uD800\uDC00-\uDBFF\uDFFF]");
x_contact_method = INVALID_XML_CHARS.matcher(x_contact_method).replaceAll(" ");
if(x_contact_method!=null){
x_contact_method = x_contact_method.replaceAll("[\\r\\n]",",");//去除有可能有换行的字段。否则出错。
x_contact_method = x_contact_method.replaceAll("\"","'");//去除有可能有双引号的字段。否则出错
}
参考:http://stackoverflow.com/questions/93655/stripping-invalid-xml-characters-in-java
总结:学好英语,利用好谷歌,解决疑难问题不再是问题。