Filter过滤非法字符


package com.pcm.web.pubs.servlet;

import java.io.IOException;
import java.util.ArrayList;
import java.util.Iterator;
import java.util.List;
import java.util.Map;
import java.util.Set;
import java.util.StringTokenizer;

import javax.servlet.Filter;
import javax.servlet.FilterChain;
import javax.servlet.FilterConfig;
import javax.servlet.ServletException;
import javax.servlet.ServletRequest;
import javax.servlet.ServletResponse;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;

/**
* @version 1.0
* @author
*/
public class CharFilter implements Filter {

private List names = new ArrayList();
private List values = new ArrayList();

/**
* @see javax.servlet.Filter#void ()
*/
public void destroy() {

}

/**
* @see javax.servlet.Filter#void (javax.servlet.ServletRequest, javax.servlet.ServletResponse, javax.servlet.FilterChain)
*/
public void doFilter(
ServletRequest req,
ServletResponse res,
FilterChain chain)
throws ServletException, IOException {

int skipNum = 0;

HttpServletRequest request = (HttpServletRequest) req;

HttpServletResponse response = (HttpServletResponse) res;

Map map = request.getParameterMap();
Set keySet = map.keySet();

StringBuffer url = request.getRequestURL().append("?");

for (Iterator it = keySet.iterator(); it.hasNext();) {
String name = it.next().toString();
String value = request.getParameter(name);

//=======================开始过滤字符=====================================
if (value != null) {

System.out.println(
" ================== " + names + " " + values);

boolean bTrim = !value.equals(value.trim());
//两端空格
if (bTrim) {
value = value.trim();
skipNum++;
}

StringBuffer tmp = new StringBuffer(value);

boolean bSkip = false;
for (int i = 0; i < names.size(); i++) {
if (tmp.toString().indexOf((String) names.get(i)) != -1) {
bSkip = true;
break;
}
}

if (bSkip) {

//这里比较麻烦,是因为我用的jdk 1.3

//如果使用jdk 1.4以上版本,直接使用replaceAll()方法,即可替换所有的字符

//jdk 1.4 替换' 为 "" : value.replaceAll("\'","\"") ,够简单吧
for (int i = 0; i < tmp.length(); i++) {
char tmpChar = tmp.charAt(i);
for (int j = 0; j < names.size(); j++) {

if (String
.valueOf(tmpChar)
.equalsIgnoreCase(names.get(j).toString())) {
tmp.replace(i, i + 1, values.get(j).toString());
}

}
}
skipNum++;
value = tmp.toString();
}

//单引号
boolean bYinHao = tmp.toString().indexOf("\'") != -1;
if (bYinHao) {
for (int i = 0; i < url.length(); i++) {
if (tmp.charAt(i) == '\'') {
tmp.replace(i, i + 1, "\"");
}
}
skipNum++;
value = tmp.toString();
}

}
//=======================================================================

url.append(name).append("=").append(value).append("&");
}

if (skipNum > 0) {
System.out.println(url);
String urlStr = url.toString();
//注意,这里是要把编码再从gb2312倒转为ISO8859-1,因为表单参数传递使用的是ISO8859-1编码
urlStr = new String(urlStr.getBytes("gb2312"), "ISO8859-1");
response.sendRedirect(urlStr);
} else {
chain.doFilter(request, response);
}

}
/**
* Method init.
* @param config
* @throws javax.servlet.ServletException
*/
public void init(FilterConfig config) throws ServletException {

String charName = config.getInitParameter("charName");
String charValue = config.getInitParameter("charValue");

//这里比较麻烦,是因为我使用的是jdk1.3

//如果jdk 1.4以上, String[] names=charName.spilt(",");

//就可以把字符串按指定分割符分割为数组

StringTokenizer stkName = new StringTokenizer(charName, ",");
while (stkName.hasMoreTokens()) {
names.add(stkName.nextToken());
}

StringTokenizer stkValue = new StringTokenizer(charValue, ",");
while (stkValue.hasMoreTokens()) {
values.add(stkValue.nextToken());
}

}
}

2.web.xml配置filter

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE web-app PUBLIC "-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN" "http://java.sun.com/dtd/web-app_2_3.dtd">
<web-app id="WebApp">
<display-name>TclRender</display-name>

<filter>
<filter-name>CharFilter</filter-name>
<display-name>CharFilter</display-name>
<filter-class>com.pcm.web.pubs.servlet.CharFilter</filter-class>
<init-param>
<param-name>charName</param-name>
<param-value>',^</param-value> <!-- , 为分隔符 -->
</init-param>
<init-param>
<param-name>charValue</param-name>
<param-value>",~</param-value>
</init-param>
</filter>
<filter-mapping>
<filter-name>CharFilter</filter-name>
<url-pattern>/*</url-pattern>
</filter-mapping>
在Java中过滤非法字符可以通过使用正则表达式结合过滤器来实现。 首先,我们可以定义一个过滤器类,实现javax.servlet.Filter接口。在过滤器的doFilter方法中,我们可以获取请求的参数或者请求的输入流,然后使用正则表达式匹配非法字符。 例如,我们可以使用正则表达式[^\u4e00-\u9fa5a-zA-Z0-9]来匹配除中文、英文和数字之外的字符。如果匹配到了非法字符,我们可以将其替换为空字符串或者做其他处理,然后将过滤后的参数再传递给下一个过滤器或者Servlet处理。 下面是一个简单的Java过滤器示例: ```java import javax.servlet.*; import javax.servlet.annotation.WebFilter; import java.io.IOException; import java.util.regex.Matcher; import java.util.regex.Pattern; @WebFilter("/your-servlet-url") public class IllegalCharacterFilter implements Filter { private Pattern illegalCharacterPattern; @Override public void init(FilterConfig filterConfig) throws ServletException { // 初始化非法字符的正则表达式 illegalCharacterPattern = Pattern.compile("[^\\u4e00-\\u9fa5a-zA-Z0-9]"); } @Override public void doFilter(ServletRequest servletRequest, ServletResponse servletResponse, FilterChain filterChain) throws IOException, ServletException { // 获取请求的参数 String parameter = servletRequest.getParameter("your-parameter-name"); if (parameter != null) { // 使用正则表达式过滤非法字符 Matcher matcher = illegalCharacterPattern.matcher(parameter); parameter = matcher.replaceAll(""); // 重新设置过滤后的参数 servletRequest.setAttribute("your-parameter-name", parameter); } // 继续执行过滤器链 filterChain.doFilter(servletRequest, servletResponse); } @Override public void destroy() { // 过滤器销毁时的操作 } } ``` 上述示例中,我们通过在过滤器的init方法中初始化了非法字符的正则表达式,然后在doFilter方法中获取请求参数,并使用正则表达式替换非法字符。最后,将过滤后的参数重新设置到请求中,再继续执行过滤器链。 使用这种方式,我们可以有效地过滤非法字符,保证输入的数据不包含不合法的内容。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值