在开发中发现中文处理是件很麻烦的事情, 现将部分内容记录如下:
jsp 文件编码: UTF-8
Tomcat 的 URI 编码: UTF-8
1. 获取表单数据.
String aTest = request.getParameter("test");
if (aTest != null && !aTest.equals("") {
aTest = new String(aTest.getBytes("ISO-8859-1"), "UTF-8")
}
2. 涉及到文件操作时, 编码与系统平台有关系. Windows 平台的文件系统编码为: Cp1252, FreeBSD 的文件系统编码为: ISO-8859-1. Windows 的 Cp1252 默认是支持中文的, 而在 FreeBSD 下则需要转换. 在 FreeBSD 上如下所示:
// 转为系统编码
aTest = new String(aTest.getBytes("GBK"), "ISO-8859-1"));
// 转为中文
aTest = new String(aTest.getBytes("ISO-8859-1"), "GBK"));
将中文输出到日志时, 转为系编码才会正常显示.
3. URL 后面的参数.在页面跳转时, 数据不能通过表单来传递, 因此只能加在 URL 后面. 不同的平台处理的方法并不相同.
在 Windows 下:
读取:直接解析查询字符串,值 (aParameter) 的处理如下:
java.net.URLDecoder.decode(aParameter).getBytes("ISO-8859-1"), "GBK")
设置:将中文先转换为 ISO-8859-1
response.sendRedirect(new String(aURL.getBytes("GBK"), "ISO-8859-1"))
jsp 文件编码: UTF-8
Tomcat 的 URI 编码: UTF-8
1. 获取表单数据.
String aTest = request.getParameter("test");
if (aTest != null && !aTest.equals("") {
aTest = new String(aTest.getBytes("ISO-8859-1"), "UTF-8")
}
2. 涉及到文件操作时, 编码与系统平台有关系. Windows 平台的文件系统编码为: Cp1252, FreeBSD 的文件系统编码为: ISO-8859-1. Windows 的 Cp1252 默认是支持中文的, 而在 FreeBSD 下则需要转换. 在 FreeBSD 上如下所示:
// 转为系统编码
aTest = new String(aTest.getBytes("GBK"), "ISO-8859-1"));
// 转为中文
aTest = new String(aTest.getBytes("ISO-8859-1"), "GBK"));
将中文输出到日志时, 转为系编码才会正常显示.
3. URL 后面的参数.在页面跳转时, 数据不能通过表单来传递, 因此只能加在 URL 后面. 不同的平台处理的方法并不相同.
在 Windows 下:
读取:直接解析查询字符串,值 (aParameter) 的处理如下:
java.net.URLDecoder.decode(aParameter).getBytes("ISO-8859-1"), "GBK")
设置:将中文先转换为 ISO-8859-1
response.sendRedirect(new String(aURL.getBytes("GBK"), "ISO-8859-1"))