背景:
在作业过程中写了如下的代码:
PrintWriter out = response.getWriter();
out.println("<html><head><title>CounterServlet</TITLE></head>");
out.println("<body>");
out.println("<h1>欢迎光临本站,你说第 " + counter.getCount()+"个访问者</h1>");
out.println("</body></html>");
中文乱码了,有点经验都知道这很正常需要设置返回的编码
于是我加下了如下的编码:
response.setContentType("text/html;charset=utf-8");
好吧,然并卵,仍然乱码。
结果:
这次的结果又是我理解错了,以为返回的编码应该和jsp页面的pageEncoding相关,
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%>
然而结果是Web组件中返回的字符编码与你的编译器设置的默认编码是相关的。
所以我把我的Myeclipes的默认编码改成UTF-8就好(MyEclipse与Eclipse的默认编码好像都是GBK);
这样乱码问题就解决了
额外收获:
解决之后我发现如果我设置返回编码为GBK或gb2312也不会有乱码,这其中经过我实验和网上查资料发现其实UTF-8与GBK和gb2312是有兼容关系的;
具体的兼容关系如下:
UTF-8>GBK>gb2312
大的兼容小的,然而大的数据库也大。
UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,又称万国码。
GB2312是中国规定的汉字编码,也可以说是简体中文的字符集编码;
GBK 是 GB2312的扩展 ,除了兼容GB2312外,它还能显示繁体中文,还有日文的假名