XML中特殊字符过滤(含Java代码)

[size=medium] 在XML规范中,不支持ASCII前31个字符中的相当多控制符号,所以在组装XML时需过滤这些特殊字符,以免引起解析问题。对于这些特殊字符,常见的异常如:
[quote]Character reference "&#12" is an invalid XML character.

这里的"&#12表示是ASCII码的第几个控制字符[/quote]

同时,'&'(实体引用的开始)和'<'(控制符的开始)作为XML的标准控制字符[b]必须[/b]不能出现在正常内容中,如果出现的话,需要转义。XML提供CDATA结构段用来指示XML解析器不要对CDATA段中的数据做处理。但如果在CDATA段中包含CDATA段的关闭符']]>'的话,还是会出现解析问题。

[color=blue]正常CDATA段示例[/color]
[quote]CDStart ::= '<![CDATA['
CData ::= (Char* - (Char* ']]>' Char*))
CDEnd ::= ']]>'[/quote]

用类似的代码解决这类烦人问题[/size]
/**
* @see http://www.w3.org/TR/2004/REC-xml-20040204/#charsets
* All supported characters
* @param data
* content in each field
* @return
* regular content is filtered from illegal XML char
*/
public static String checkXmlChar(String data) {
StringBuffer appender = new StringBuffer("");

if (StringUtils.isNotBlank(data)) {
appender = new StringBuffer(data.length());

for (int i = 0; i < data.length(); i++) {
char ch = data.charAt(i);
if ((ch == 0x9) || (ch == 0xA) || (ch == 0xD)
|| ((ch >= 0x20) && (ch <= 0xD7FF))
|| ((ch >= 0xE000) && (ch <= 0xFFFD))
|| ((ch >= 0x10000) && (ch <= 0x10FFFF)))
appender.append(ch);
}
}

String result = appender.toString();

return result.replaceAll("]]>", "");
}
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
是的,Java可以使用过滤器来过滤用户输入的非法字符。通常情况下,我们会创建一个实现了javax.servlet.Filter接口的类,并在web.xml文件定义该过滤器的拦截规则。 在过滤,我们可以使用Java的正则表达式来判断用户输入是否合法,然后根据情况来处理用户输入。比如,我们可以将非法字符替换成空格或者其他合法的字符。 以下是一个示例代码: ```java public class IllegalCharacterFilter implements Filter { @Override public void init(FilterConfig config) throws ServletException { // 初始化操作 } @Override public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain) throws IOException, ServletException { HttpServletRequest httpRequest = (HttpServletRequest) request; String input = httpRequest.getParameter("input"); // 获取用户输入 String pattern = ".*[<>\"\'%;()&+]*.*"; // 匹配非法字符的正则表达式 if (input.matches(pattern)) { // 如果输入包非法字符 input = input.replaceAll("[<>\"\'%;()&+]", " "); // 将非法字符替换成空格 httpRequest.setAttribute("input", input); // 将处理后的输入放入request } chain.doFilter(request, response); // 继续执行下一个过滤器或Servlet } @Override public void destroy() { // 销毁操作 } } ``` 在web.xml文件定义该过滤器的拦截规则: ```xml <filter> <filter-name>IllegalCharacterFilter</filter-name> <filter-class>com.example.IllegalCharacterFilter</filter-class> </filter> <filter-mapping> <filter-name>IllegalCharacterFilter</filter-name> <url-pattern>/*</url-pattern> </filter-mapping> ``` 这样,所有的请求都会被该过滤器拦截,并进行非法字符的过滤处理。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值