14_字符编码


编码表的由来:
  • 计算机只能识别二进制数据,早起由来是电信号。
  • 为了方便应用计算机,让它可以识别各个国家的文字。
  • 就将各个国家的文字用数字来表示,并一一对应,形成一张表。这就是编码表。
常见的编码表:
  • ASCII:美国标准信息交换码。用一个字节的7位可以表示
  • ISO8859-1:拉丁码表。欧洲码表。用一个字节8位表示。
  • GB2312:中国的中文编码表。
  • GBK:中国的中文编码表升级,融合了更多的中文文字符号。
  • Unicode:国际标准码,融合了多种文字。所有文字都用两个字节来表示,Java语言使用的就是Unicode
  • UTF-8:最多使用三个字节来表示一个字符。
  • ...
读出的字符是乱码的原因:
示例:


编程演示:
import java.io.UnsupportedEncodingException;
import java.util.Arrays;

/*
解码:字符串变成字节数组。
解码:字节数组变成字符串。
String-->byte[];   str.getBytes(charsetName);
byte[]-->String:new String(byte[],charsetName);
*/
 class EncodeDemo {

	public static void main(String[] args) throws UnsupportedEncodingException {
		// TODO Auto-generated method stub
//		test();
		test_2();
	}

	//演示编码出错的情况
	public static void test() throws UnsupportedEncodingException{
		String s="你好";
		
		//已gbk形式编码
		byte b1[]=s.getBytes("gbk");
		//解码
		String s1=new String(b1,"gbk");
		System.out.println("用gbk编码,用gbk解码(正确):"+s1);
		
		
		//如果用utf-8解码,就会出现错误
		String s2=new String(b1,"utf-8");
		System.out.println("用gbk编码--用utf-8解码(出错):"+s2);
		
		
		//用utf-8形式编码
		byte b2[]=s.getBytes("utf-8");		
		//如果用gbk解码,就会出现错误
		String s3=new String(b2,"gbk");
		System.out.println("用utf-8编码,用gbk解码(出错):"+s3);
	}
	
	//其中一种乱码的解决办法(重新再编码、解码)
	public static void test_2() throws UnsupportedEncodingException{
		String s="你好";
		//用gbk编码
		byte[] b1=s.getBytes("gbk");
		//打印出"你好"的gbk编码
		System.out.println("你好的gbk编码:"+Arrays.toString(b1));
		//用iso8859-1解码,出错
		String s1=new String(b1,"iso8859-1");
		System.out.println("用iso解码的结果:"+s1);
		
		
		//再对s1进行iso8859-1编码
		byte b2[]=s1.getBytes("iso8859-1");
		System.out.println("重新编码的结果:"+Arrays.toString(b2));
		
		//用gbk解码
		String s2=new String(b2,"gbk");
		System.out.println("重新解码的结果:"+s2);
	}
}

图片演示:


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值