由于计算机中的数据都是以二进制形式存储的,因此,在传输数据时,就会发生字符与字节之间的转换。字节与字符之间的转换是通过查码表来进行的,(一个字节通常8位长)所以字符转字节是编码,字节转字符是解码。当字符编码和解码用的不是同一个字符集的时候,就会发生问题。
出现乱码的原因是因为response对象的字符输出流在编码时采用的是,ISO-8859-1的字符码表,该码表并不兼容中文。在ISO-8859-1的码表中查不到的字符就会显示63。当浏览器对接收到的数据进行解码时,会采用默认的码表GB2311。
如何解码出现的浏览器乱码问题呢?有三种方式,第一种就是设置我们servlet程序使用的字符码表,然后在设置浏览器接收响应消息时使用的字符码表。但是这种方法太过于麻烦,因为不可能每次都这样。所以又有了以下两种方式,就是设置servlet程序的编码格式,然后在设置浏览器的解码格式。其中都在servlet程序中进行,
/* //设置字符编码使用的码表 resp.setCharacterEncoding("utf-8"); //通知浏览器使用utf-8解码 resp.setHeader("Content-Type","text/html;charset=utf-8");*/
但是我们为了在写代码的时候让代码更简洁,简短,所以采用最好的一种方式,就是使用ServletResponse的setContnedType("text/html;charset=utf-8")方法。