网页请求编码分析
pageEncoding值得是jsp文件本身的保存编码格式
<%@ page language="java" contentType="text/html; charset=utf-8"
pageEncoding="UTF-8"%>
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UFT-8">
<title>encoding</title>
</head>
<body></body></html>
页面编码:由page指令中的pageEncoding和charset决定,前者优先权高,两者都不写则是 ISO-8859-1
响应编码
响应的编码根本上是由ServletResponse对象的characterEncoding属性决定的。
具体一次取决于page指令的contentType中的charset,然后是pageEncoding。大体和上面是反的
如果只设置page指令的contentType,容易保证了页面编码和响应编码的统一
1. page指令的contentType影响的是HTTP响应头Content-Type。而元素中的Content-Type则只是一段文本内容,只有当HTTP响应头中没有Content-Type时浏览器才会检测这段文本。
2. 在现在的浏览器中,GET和POST请求数据的编码只受HTML元素的Content-Type影响。为了保持统一,很多网站的做法是把URL里面的中文和特殊字符用JavaScript的URL encode。
3. 任何请求都需要先经过服务器处理,先由服务器读取URL才知道该传给什么Servlet。POST和GET的URL,都受服务器配置URIEncoding的影响,但是POST在通过URL读取成功之后,它的数据不在URL中,所以设置ServletRequest的characterEncoding才能正确读取。
url请求乱码
post请求
这个今天上传图片的时候遇到中文名字乱码的问题,研究了一下。对于post请求,我们可以
1. 使用request.setCharacterEncoding方法来处理
依赖于web服务器来处理的,并不是所有的web服务器都是支持的
get请求
get请求不能使用request.setCharacterEncoding,因此可以
1. *String name = new Strring(request.getParater(“name”).getBytes(“ISO-8859-1”),”GBK”)
依赖于java处理的
可以在conf/server.xml中配置URIEncoding=”UTF-8” 编码来处理
tomcat默认使用ISO-8859-1编码,因此一个通用有效的方法就是设置web服务器的server.xml文件添加URIEncoding=”UTF-8”配置