前言
在使用Java进行Web开发的时候,会遇到一个常见的问题就是字符的编码问题,特别是中文的数据,如果没处理好就会显示乱码。
在需要用到数据库时,很有可能就会发生问题,比如要对数据库表进行查询,但是由于从前端接收到的字符串格式不对,从而导致无法查询到结果。
我们在做web开发的时候一般使用的服务器是Tomcat,服务器的编码格式也很重要。
一、Tomcat的编码格式
如何设置 Tomcat编码格式为UTF-8
利用request.setCharacterEncoding(“UTF-8”);来设置Tomcat接收请求的编码格式,只对POST方式提交的数据有效,对GET方式提交的数据无效!
要设置GET的编码,可以修改server.xml文件中,相应的端口的Connector的属性:URIEncoding=“UTF-8”,这样,GET方式提交的数据才会被正确解码。
<Connector port="8080" protocol="HTTP/1.1"
connectionTimeout="20000"
redirectPort="8443" URIEncoding="UTF-8" />
Tomcat8以后默认编码格式是utf-8;7之前的都是iso8859-1
如果默认情况下,tomcat使用的的编码方式:iso8859-1
二、form在前端以post 和get提交的数据处理方式
后端若不对中文数据的字符串进行处理,显示处理的结果可能会是问号
例如这些:�� ??
下面重点讲解如何处理:
(一) 、 form在前端以post方式提交数据:
浏览器将数据(假设为“你好”)发送给服务器的时候,将数据变成0101的二进制数据(假设为98 99)时必然要查码表,浏览器以哪个码表打开网页,浏览器就以哪个码表提交数据。数据到达服务器后,数据(98 99)要封装到request中,在servlet中调用Request的getParameter方法返回的是字符串(“你好”),方法内部拿到数字后要转成字符,一定要查码表,由于request的设计者是外国人,所以默认查的是他们常用的ISO8859-1,这就是请求数据产生乱码的根源。
前端JSP代码
<%@ page contentType="text/html;charset=UTF-8" language="java" %>
<html>
<head>
<title>TEST</title>
</head>
<body>
<div id="main">
<form action="${pageContext.request.contextPath}/s" method="post">
<input type="text" name="data" />
<input type="submit" value="submit"/>
</form>
<p> ${requestScope.msg}</p>
</div>
</body>
</html>
后端servlet代码
import javax.servlet.ServletException;
import javax.servlet.annotation.WebServlet;
import javax.servlet.http.HttpServlet;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;
import java.io.IOException;
import java.nio.charset.StandardCharsets;
@WebServlet(name = "Servlet",urlPatterns = {"/s"})
public class Servlet extends HttpServlet {
protected void doPost(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
// request.setCharacterEncoding("utf-8");
response.setCharacterEncoding("utf-8");
response.setContentType("text/html;charset=utf-8");
String data=request.getParameter("data");
byte[] byte_data=data.getBytes("iso8859-1");
data=new String(byte_data,StandardCharsets.UTF_8);
request.setAttribute("msg",data);
request.getRequestDispatcher("/test.jsp").forward(request, response);
System.out.println(data);
}
protected void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
doPost(request,response);
}
}
二:form在前端以get方式提交数据:
get方式提交的数据依然是浏览器用什么码表打开就用什么码表发送。不同的是,以get方式提交数据时,request设置编码无效。即使设置了UTF-8还是会去查ISO8859-1。得到(?
?),要解决这个问题,需要拿着(??)反向查ISO8859-1,拿到(98 99)后,再去查正确码表。
前端JSP代码
<%@ page contentType="text/html;charset=UTF-8" language="java" %>
<html>
<head>
<title>TEST</title>
</head>
<body>
<div id="main">
<form action="${pageContext.request.contextPath}/s" method="get">
<input type="text" name="data" />
<input type="submit" value="submit"/>
</form>
<p> ${requestScope.msg}</p>
</div>
</body>
</html>
后端servlet代码:
import javax.servlet.ServletException;
import javax.servlet.annotation.WebServlet;
import javax.servlet.http.HttpServlet;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;
import java.io.IOException;
import java.io.PrintWriter;
import java.nio.charset.StandardCharsets;
@WebServlet(name = "Servlet",urlPatterns = {"/s"})
public class Servlet extends HttpServlet {
protected void doPost(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
request.setCharacterEncoding("utf-8");
response.setCharacterEncoding("utf-8");
response.setContentType("text/html;charset=utf-8");
String data=request.getParameter("data");
request.setAttribute("msg",data);
request.getRequestDispatcher("/test.jsp").forward(request, response);
System.out.println(data);
protected void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
doPost(request,response);
}
}
参考文章:https://www.cnblogs.com/panxuejun/p/6837677.html