JAVA乱码之Byte分析

在做WEB开发的时候经常会遇到乱码问题,在解析字节数组的时候指定其编码方式即可。

 

Testing...

 

public class CodeTest {

	public static void main(String[] args) {
		execute();
	}

	private static void execute() {
		String s = "hello,你好!";
		byte[] bytesISO8859 = null;
		byte[] bytesGBK = null;
		try {
			bytesISO8859 = s.getBytes("iso-8859-1");
			bytesGBK = s.getBytes("GBK");
		} catch (java.io.UnsupportedEncodingException e) {
			e.printStackTrace();
		}
		System.out.println("--------------\n 8859 bytes:");
		System.out.println("bytes is:     " + arrayToString(bytesISO8859));
		System.out.println("hex format is:" + encodeHex(bytesISO8859));
		System.out.println();
		System.out.println("--------------\n GBK bytes:");
		System.out.println("bytes is:" + arrayToString(bytesGBK));
		System.out.println("hex format is:" + encodeHex(bytesGBK));
	}

	public static final String encodeHex(byte[] bytes) {
		StringBuffer buff = new StringBuffer(bytes.length * 2);
		String b;
		for (int i = 0; i < bytes.length; i++) {
			b = Integer.toHexString(bytes[i]);
			// byte是两个字节的,而上面的Integer.toHexString会把字节扩展为4个字节
			buff.append(b.length() > 2 ? b.substring(6, 8) : b);
			buff.append(" ");
		}
		return buff.toString();
	}

	public static final String arrayToString(byte[] bytes) {
		StringBuffer buff = new StringBuffer();
		for (int i = 0; i < bytes.length; i++) {
			buff.append(bytes[i] + " ");
		}
		return buff.toString();
	}

}

 

结果:

 

--------------
8859 bytes:
bytes is:          104 101 108 108 111 63 63 63 63 
hex format is:     68  65  6c  6c  6f  3f 3f 3f 3f 

--------------
GBK bytes:
bytes is:          104 101 108 108 111 -93 -84 -60 -29 -70 -61 -93 -95 
hex format is:     68  65  6c  6c  6f  a3  ac  c4  e3  ba  c3  a3  a1 

 

可见,在s中提取的8859-1格式的字节数组长度为9,中文字符都变成了“63”,ASCII码为63的是“?”,一些国外的程序在国内中文环境下运行时,经常出现乱码,上面布满了“?”,就是因为编码没有进行正确处理的结果。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值