WEB开发中的JAVA字符编码经验总结

最新推荐文章于 2016-10-18 14:14:00 发布

zijie405

最新推荐文章于 2016-10-18 14:14:00 发布

阅读量420

点赞数

分类专栏： web 文章标签： java web开发 string jsp 数据库 tomcat

本文链接：https://blog.csdn.net/zijie405/article/details/5979349

版权

3 篇文章 0 订阅

订阅专栏

1 JSP中的编码

(1) 静态声明:

CHARSET有两个作用：

JSP文件的编码方式：在读取JSP文件、生成JAVA类时，源JSP文件中汉字的编码
JSP输出流的编码方式：在执行JSP时，往response流里面写入数据的编码方式

(2) 动态改变:在往response流里面写数据前可以调用response.setContentType()，设定正确的编码类型。

(3) 在TOMCAT中，由Request.getParameter() 得到的参数，编码方式都是ISO8859_1。所以如果在浏览器输入框内输入一个汉字“英”，在服务器端就得到一个ISO8859_1编码的（0x00,0xD3,0x00,0xA2）。所以通常在接收参数时转码：

String wrongStr = response.getParameter(“name”);
String correctStr = new String(wrongStr.getBytes(“ISO8859_1”),”GB2312”);

在最新的SERVLET规范里面，也可以在获取参数之前执行如下代码：

request.setCharacterEncoding(“GB2312”);

4．2 数据库的编码

(1) 数据库使用UTF-16

如果String中是UNICODE字符，写入读出时不需要转码

(2) 数据库使用ISO8859_1

如果String中是UNICODE字符，写入读出时需要转码

写入：String newStr = new String(oldStr.getByte(“GB2312”), “ISO8859_1”);
读出：String newStr = new String(oldStr.getByte(“ISO8859_1”),”GB2312”);

5．2 源文件

源文件的编码方式和编辑平台相关。在WINDOWS平台下开发的源文件，以GB2312方式编码。在编译的时候，需要指定源文件的编码方式：
javac –encoding GB2312

JAVA编译后生成的字节文件的编码为UTF-8。

    ①最新版TOMCAT4.1.18支持request.setCharacterEncoding(String enc)
    ②资源文件转码成company.name=/u82f1/u65af/u514b
    ③如果数据库使用utf-16则不需要这部分转码
    ④页面上应有

    转码ⅰ:
    String s = new String
    (request.getParameter(“name”).getBytes(“ISO8859_1”),”GB2312”);

转码ⅱ:
String s = new String(name.getBytes(“GB2312”),”ISO8859_1”);

转码ⅲ:
String s = new String(name.getBytes(“ISO8859_1”),” GB2312”);

关注

专栏目录