IO流转换流的字符编码

    (1)字符流的出现为了方便操作字符,更重要的是加入了编码转换
    (2)通过子类转换流来完成
        InputStreamReander
        OutputStreamWriter
    (3)在两个子类对象进行构造的时候可以加入编码表
    (4)编码表:
        将各个国家的文字用二进制数字表示并一一对应,形成一张表,这就是编码表
    (5)常见的编码表:
        **ASCII:美国标准信息交换码,用一个字节的七位表示
        **ISO8859-1:拉丁码表,欧洲码表,用一个字节的八位表示
        **GB2312:中文编码表,用两个字节表示
        **GBK:中文编码表升级,融合录入更多的中文字符,用两个字节表示,为避免和老美重复
               两字节的最高位都是1,即汉字都是用负数表示
        **Unicode:国际标准码,融合了多种文字,所有文字都用两个字节表示
        **UTF-8:用一个字节到三个字节表示。
        注:Unicode能识别中文,UTF-8也能识别中文,但两种编码表示一个汉字所用的字节数不同
        Unicode用两个字节,UTF-8用三个字节,故涉及到编码转换。
    (6)在流中涉及编码表的转换只有转换流:
        InputStreamReander
        OutputStreamWriter
    (7)代码示例:
        public static void write() throws IOException
        {
            OutputStreamWriter osw1 = new OutputStreamWriter(new FileOutputStream("gbk.txt"),"GBK");
            osw1.write("你好");
            osw1.close();

            OutputStreamWriter osw2 = new OutputStreamWriter(new FileOutputStream("utf-8.txt"),"UTF-8");
            osw2.write("你好");
            osw2.close();
        }
        public static void read() throws IOException
        {
            InputStreamReader isr = new InputStreamReader(new FileInputStream("gbk.txt"),"GBK");
            byte[] buf = new byte[1024];
            int len = isr.read(buf);
            sop(new String(buf,0,len));
        }
    (8)编码解码
        编码:字符串变成字节数组:String-->getBytes()-->byte[]()
        解码:字节数组变成字符串:byte[]-->new String(byte[],0,len)-->String
    (9)代码示例:
        public static void main(String[] args)
        {
            //编码解码1:默认编码
            String str1 = "你好";
            byte[] buf1 = str1.getBytes();//默认解码:Unicode,四个字节

            //编码解码2:指定编码
            String str2 = "你好";
            byte[] buf2 = str2.getBytes("UTF-8");//指定解码:UTF-8,六个字节

            
            //编码解码3:编码正确解码错误
            String str3 = "你好";
            byte[] buf3 = str3.getBytes("GBK");//指定编码:GBK,四个字节
            String str3 = new String(buf3,"ISO8859-1");//错误解码

            //编码解码4:错误编码正确解码
            String str4 = "你好";
            byte[] buf4 = str4.getBytes("ISO8859-1");//错误编码
            String str4 = new String(buf4,"GBK");//正确解码,读不出来

            //编码解码5:编码对了,但是解码错误了,怎么办呢?
            //此时可以将错误的解码再错编回去,载用正确编码解码
            String str5 = "你好";
            byte[] buf5 = str5.getBytes("GBK");//正确编码
            String str6 = new String(buf5,"ISO8859-1");//错误解码,读不出来
            byte[] buf6 = str6.getBytes("ISO8859-1");//再错误编码
            String str7 = new String(buf6,"GBK");//再正确解码,这样就可以读出来了
        }

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值