作者: 永恒の_☆ 地址: http://blog.csdn.net/chenghui0317/article/details/7881454
一、常见的字符集和字符编码有哪些?
字符就是字符的集合,字符编码就是呈现给电脑识别的二进制格式的字节。
(1)ascii 字符集,主要针对美国人使用的,每一个字符均采用采用8个字节保存,可以保存 128 (2<<6)字符。
(2)iso-8859-1 字符集,阿拉伯字符集,比ascii字符集强大,能基于ascii字符集保存更多ascii以外的字符,可以这么说iso-8859-1 基本可以取代ascii。
(3)GB2312 最早的中文编码字符集
(4)GBK 在GB2312的基础上进行扩充的中文字符集
(5)GB18013 目前最为齐全的中文编码字符集
(6)Unicode 国际编码的字符集,也就是可以容纳全球几乎所有的字符集,它是一个可变长度的保存方式,最长有32位长度。
二、常见的乱码有哪些呢?怎么处理?
(1) 表单的post 提交方式,
可以在处理页面加上 request.setCharacterEncoding(“UTF-8”) 即可;
或者手动为每一个字符串转码,例如:param = new String(param.getBytes(“ISO-8859-1”),”UTF-8”);
如何有用到struts2框架, 可以加上常量:<constant name="struts.i18n.encoding" value="UTF-8"></constant> 也可以。
(2) 表单的get提交方式,如果使用的时Tomcat服务器,则可以在tomcat安装目录下的conf\server.xml 中找到与自己端口号相匹配的connecter连接器,加上URIEncoding=”UTF-8”,也可以手动转码,如上。
(3) 页面乱码:比较常见的是页面编码格式不统一导致的,所以平时编码要养成规范的习惯。
还有就是 自身浏览器与网页的编码格式不一致,这时可以手动改动可以解决。
三、过滤器的好处有哪些呢?(1) 在处理编码的时候,如果大量修改编码势必造成代码冗余,可以使用一个过滤器Filter将所有的处理请求拦截,进行编码处理之后在放行,这样就可以统一处理了。
(2) 再就是做一个权限检查,因为filter可以拦截所有请求,所有可以定义filter 做权限检查。
(3) 保护资源,如果进行不应该进入的地址,强行终止。
四、如何可以有效的防止别人恶意代码侵袭,比如最常见的脚本注入?
(1)因为一个请求你接受到之后只能先接收后再进行处理,不能再赋值,比如request有getParameter();但是没有setParamter();
(2)可以自己定义一个request的包装类,RequestWrapper,使之实现HttpServletRequestWrapper类,重写getParameter()方法 ,在里面去进行特殊的标签符号的处理就可以了。
/**
* 自定一个request对象的包装类
* @author Administrator
*
*/
public class RequestWrapper extends HttpServletRequestWrapper{
public RequestWrapper(HttpServletRequest request) {
super(request);
}
//通过覆盖之前的getParameter()来替换但凡所有请求中的特殊字符串
@Override
public String getParameter(String name) {
String content = super.getParameter(name);
content = content.replaceAll("<", "<");
content = content.replaceAll(">", ">");
content = content.replaceAll("\"", """);
content = content.replaceAll(" ", " ");
return content;
}
//然后在过滤器那边就传入自己定义的RequestWrapper类的实例就可以了
filterChain.doFilter(new RequestWrapper((HttpServletRequest)request),response);