最近用socket通讯,用IO流发送接收数据,双方约定好了接口规范,字段的长度,但是发现发过来的数据老是报数组溢出错误,后来发现windows和linux的默认编码格式不一样,前者是gbk,后者是utf-8,而一个中文gbk是2个字节,utf-8是3个字节,用getBytes()将字符串转换为字节数组,若不指定编码方式,则会根据平台的默认编码方式,故若是不指定编码格式的话的话,那么将程序部署到linux下后一个中文汉字就是3个字节,此时若你指定的byte[80]接收40个汉字,那么此时用getBytes()转换后实际上是有120个字节,就会导致溢出。
下面举一个简单的例子(在windows下):
public class Test {
public static void main(String[] args) {
String a="哈哈";
try {
byte[] aa = a.getBytes("GB2312");
byte[] ab = a.getBytes("UTF-8");
byte[] ac = a.getBytes();
System.out.println(aa.length);
System.out.println(ab.length);
System.out.println(ac.length);
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
输出是:4 6 4