JSP编码常识[转]

最新推荐文章于 2024-11-09 21:51:58 发布

monkeyfeng

最新推荐文章于 2024-11-09 21:51:58 发布

阅读量557

点赞数

文章标签： jsp string 数据库 exception servlet 浏览器

GBK编码

GBK编码是中国制订的、等同于UCS的新的中文编码扩展国家标准。GBK工作小组于1995年10月，同年12月完成GBK规范。该编码标准兼容GB2312，共收录汉字21003个、符号883个，并提供1894个造字码位，简、繁体字融于一库。

UTF-8编码

UTF-8编码可以通过屏蔽位和移位操作快速读写。字符串比较时strcmp()和wcscmp()的返回结果相同，因此使排序变得更加容易。字节FF和FE在UTF-8编码中永远不会出现，因此他们可以用来表明UTF-16或UTF-32文本（见BOM） UTF-8 是字节顺序无关的。它的字节顺序在所有系统中都是一样的，因此它实际上并不需要BOM。

GB2312

GB2312支持的汉字太少。1995年的汉字扩展规范GBK1.0收录了21886个符号，它分为汉字区和图形符号区。汉字区包括21003个字符。2000年的GB18030是取代GBK1.0的正式国家标准。该标准收录了27484个汉字，同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字。现在的PC平台必须支持GB18030，对嵌入式产品暂不作要求。所以手机、MP3一般只支持GB2312。

从ASCII、GB2312、GBK到GB18030，这些编码方法是向下兼容的，即同一个字符在这些方案中总是有相同的编码，后面的标准支持更多的字符。在这些编码中，英文和中文可以统一地处理。区分中文编码的方法是高字节的最高位不为0。按照程序员的称呼，GB2312、GBK到GB18030都属于双字节字符集 (DBCS)。

一、JSP页面显示乱码

二、表单提交中文时出现乱码

三、数据库连接

大家在JSP的开发过程中，经常出现中文乱码的问题，可能一至困扰着您，我现在把我在JSP开发中遇到

的中文乱码的问题及解决办法写出来供大家参考。

一、JSP页面显示乱码

下面的显示页面(display.jsp)就出现乱码：

<html>
<head>
<title>JSP的中文处理</title>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
</head>

对不同的WEB服务器和不同的JDK版本，处理结果就不一样。原因：服务器使用的编码方式不同和浏览器

对不同的字符显示结果不同而导致的。解决办法：在JSP页面中指定编码方式(gb2312),即在页面的第一

行加上：

<%@ page contentType="text/html; charset=gb2312"%>
就可以消除乱码了。完整页面如下：

<%@ page contentType="text/html; charset=gb2312"%>
<html>
<head>
<title>JSP的中文处理</title>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
</head>

<body>
<%
out.print("JSP的中文处理");
%>
</body>
</html>
二、表单提交中文时出现乱码

下面是一个提交页面(submit.jsp)，代码如下：

<html>
<head>
<title>JSP的中文处理</title>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
</head>
<body>
<form name="form1" method="post" action="process.jsp">

</form>
</body>
</html>

下面是处理页面(process.jsp)代码：

<%@ page contentType="text/html; charset=gb2312"%>
<html>
<head>
<title>JSP的中文处理</title>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
</head>

如果submit.jsp提交英文字符能正确显示，如果提交中文时就会出现乱码。原因：浏览器默认使用UTF

-8编码方式来发送请求，而UTF- 8和GB2312编码方式表示字符时不一样，这样就出现了不能识别字符。

解决办法:通过request.seCharacterEncoding ("gb2312")对请求进行统一编码，就实现了中文的正常

显示。修改后的process.jsp代码如下：

<%@ page contentType="text/html; charset=gb2312"%>
<%
request.seCharacterEncoding("gb2312");
%>
<html>
<head>
<title>JSP的中文处理</title>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
</head>

三、数据库连接出现乱码

只要涉及中文的地方全部是乱码，解决办法：在数据库的数据库URL中加上
useUnicode=true&characterEncoding=GBK 就OK了。

四、数据库的显示乱码

在mysql4.1.0中,varchar类型，text类型就会出现中文乱码，对于varchar类型把它设为binary属性就

可以解决中文问题，对于text类型就要用一个编码转换类来处理，实现如下：

public class Convert {
/** 把ISO-8859-1码转换成GB2312

public static String ISOtoGB(String iso){
String gb;
try{
if(iso.equals("") || iso == null){
return "";
}

else{
iso = iso.trim();
gb = new String(iso.getBytes("ISO-8859-1"),"GB2312");
return gb;
}
}
catch(Exception e){
System.err.print("编码转换错误："+e.getMessage());
return "";
}
}
}

把它编译成class，就可以调用Convert类的静态方法ISOtoGB()来转换编码。

总结：

1. 在jsp中<%@ page contentType="text/html; charset=A" %>如果指定了，那么在改jsp中所有构造

的String（不是引用），如果沒有指定编码，那么这些String的编码是A的。

   从request的得到的String如果沒有指定request的编码的话，他是iso-8859-1的

   从别的地方得到的String是使用原來初始的编码的，比如从数据库得到String,如果数据库的编码

是B,那么该String的编码是B而不是A的，也不是系统默认的。

   此时，如果要输出的String的编码不是A,那么，很可能显示乱码的，所以首先要将String正確转化

为编码A的String,然后输出。

2. 在jsp中

<%@ page contentType="text/html; charset=A" %>
沒有指定，那么相当于指定了

<%@ page contentType="text/html; charset=ISO-8859-1" %>
3． Servelte中如果执行了像 response.setContentType("text/html;charset=A");説明将response的

字符输出流编码设置为A,所有要输出的String的编码要转化为A的，否則会得到乱码的。

   Servelet中从request得到的String的编码和jsp中一样的，但是在servlet java文件中构造的

String是使用的系统默认的编码的。在servelt中从外部得到的String 是使用原来的编码的，比如从编

码为B的数据库得到的数据是编码为B的,不是A,也不是系统默认的编码。

monkeyfeng

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫