关于jsp页面乱码的一系列问题

最新推荐文章于 2021-06-21 22:16:08 发布

r834310840

最新推荐文章于 2021-06-21 22:16:08 发布

阅读量823

点赞数

本文链接：https://blog.csdn.net/r834310840/article/details/11711715

版权

一、form表单以get方式提交。

数据直接在URL上拼接，以key-values形式，间隔以&，除了“a~z”,"A~Z","0~9",",","*","-","_","*"等字符外，其他都是不安全字符。需要进行编码。空格编码成"+"。

当出现不安全字符时，在发送到服务器时，浏览器会对这些字符进行编码。通常会是以utf-8进行编码。字符会转换成一个或多个字节（中文以二个字节）。然后每个字节会被表示成"%xy"格式的由三个字符组成的字符串。xy是字节的2位十六进制数表示（一个字节8位二进制数）。

也可以用javascript对数据进行encodeURIComponent(url);(没用过)

现在的URL就成了ASCII范围内的字符了。然后以iso-8859-1的编码方式转换成二进制随着请求头一起发送出去。对于get方式来说，没有请求实体，含有数据的url都在请求头里面。

注意：这里进行了两次编码。第一次是使用UTF－8第二次是使用iso-8859-1编码成能在网上传输的二进制。

现有问题来到了服务器端。每种服务器默认的编码方式都可能不同,比如tomcat默认编码就是iso-8859-1, 而resin默认编是utf-8。

按道理服务器端也会做两次的解码动作,第一次是对二进制内容的iso-8859-1的解码,第二次是使用服务器默认的编码对数据进行解码。

因此我们使用request.getParameter(“name”)得到的数据是经过两次解码的.

当tomcat使用iso-8859-1对数据进行第二次解码时,因为对应客户端编码是utf-8

因此我们使用request.getParameter(“name”)就肯定乱码.

如果我们不去改变tomcat的默认编码,可以使用

new String(request.getParameter(“name”).getBytes(“iso-8859-1″), “utf-8″);手工重新解

码.request.setCharacterEncoding(“utf-8″)这种方式对于get方式提交数据是无效的,

但是对post方式提交数据却是有效的.因为get没有request body.

通常的做法还是修改tomcat的默认编码:

在server.xml中的connector加上URIEncoding=”UTF-8″即可

<%@ page language="java" contentType="text/html; charset=GB18030"
pageEncoding="GB18030"%>
<%
//request.setCharacterEncoding("iso-8859-1");
String name=request.getParameter("name");

if(name!=null && !name.equals("")){
System.out.println(new String(request.getParameter("name").getBytes("iso-8859-1"), "gbk"));（第一次编码取决于 charset 是GBK这里就是GBK 是UTF8这里就是UTF－8底下有实验1）。
}
%>
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=GB18030">
<title>Insert title here</title>
</head>
<body>
<form action="Get.jsp" method=get">
姓名：<input type="text" name="name" ><br>
<input type="submit" value="上交">
</form>
</body>
</html>