Java中的编码问题

问题描述:

      我们开发了一个管理系统,底层用了powershell作为服务部分,并采用Restful形式的http接口,这个服务运行在中文版windows平台上;上层业务是用java写的,可以运行在其他的机器上。测试时,在一些机器上运行java部分会有乱码的问题,而在其他机器上却没有。

 

问题分析:

      首先了解一下背景知识:java对从外部来的字节流如果需要转换成字符流的话,需要按照某种编码方式对其进行解码,如果不显式提供编码方式的话,会使用jvm的系统变量file.encoding提供的编码方式进行解码转换。

      而底层powershell提供的服务采用json形式在http body中返回数据,因为运行在中文版windows上的缘故,在返回的数据中有时包含了一些汉字,并且powershell采用utf-8的编码方式对返回的数据进行编码处理。在没有出现乱码的机器上,file.encoding的编码方式是utf-8,和pwoershell服务采用的编码方式一致,而出现乱码的机器上,file.encoding的编码方式是GBK,这是导致乱码的根本原因。

 

既然知道了原因,下一步就是怎样修改了,有如下几个方案:

  1. 修改file.encoding的设定,将其设置成和powershell提供的服务同样的编码方式。评论:这种方式极其不好,因为file.encoding的设定影响到很多地方,具体可以看这里:http://www.blogjava.net/ivanwan/archive/2011/01/31/343810.html
  2. 在接收转换底层数据时显式指定编码方式。评论:比较好,但是缺少灵活性。将编码方式写死在代码里,灵活性最差;写在配置文件里,灵活性稍好;最灵活的方式是在http协议的头部指定。但是如果java部分要做成多语言版,就不合适了,会出现UI都是法文,但是底层提供的报错,提示等信息是另外一种语言的情况(比如中文)。
  3. 让powershell运行在英文版windows平台上,我认为这种方式最简单,适应性也最好,做成多语言版也没有问题。

 

后记:

    在做类似的项目(产品)时,我的经验是底层的平台最好都是英文版的,这样就不会碰到乱七八糟的编码问题了。

    其实任何语言都可能会碰到编码问题,这里是我的另一篇blog,简单讲了一下python中的编码问题

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值