黑马入学测试—基础—中文编码知识总结

原创 2015年11月21日 00:13:56
为什么要编码呢?在计算机中存储信息的最小单位是1个字节,即8个bit。而我们平时要展现的符号太多,无法用一个字节来完全表示。所以我们构建了一个新的数据结构char,而从char到byte就必须有编码的过程。

在java中是如何编码的。

package net.mpos.lottery.distributorwrs.test;

        /**
         * @author solo
         *
         * @date 2013-9-7
         */
        public class CodeTest {

            public static void toHex(char[] b) {
                for (int i = 0; i < b.length; i++) {
                    System.out.printf("%x " , (int)b[i]);
                }
                System.out.println();
            }

            public static void toHex(byte[] b) {
                for (int i = 0; i < b.length; i++) {
                    System.out.printf("%x " , b[i]);
                }
                System.out.println();
            }

            public static void encode() {
                String name = "I am 中文编码";
                toHex(name.toCharArray());
                try {
                    byte[] iso8859 = name.getBytes("ISO-8859-1");
                    System.out.println("ISO-8859-1:");
                    toHex(iso8859);
                    byte[] gb2312 = name.getBytes("GB2312");
                    System.out.println("GB2312:");
                    toHex(gb2312);
                    byte[] gbk = name.getBytes("GBK");
                    System.out.println("GBK:");
                    toHex(gbk);
                    byte[] utf16 = name.getBytes("UTF-16");
                    System.out.println("UTF-16:");
                    toHex(utf16);
                    byte[] utf8 = name.getBytes("UTF-8");
                    System.out.println("UTF-8:");
                    toHex(utf8);
                } catch (Exception e) {
                    e.printStackTrace();
                }
            }

            public static void main(String[] args) {
                String cn = "I am 中文编码";  // 这里存在编码转换: 将文件存储字节转成unicode存入String对象内存. 采用文件编码

                char[] charArray = cn.toCharArray();
                byte[] data = cn.getBytes();

                System.out.println("print char array : " + cn);
                toHex(cn.toCharArray());

                encode();
            }
        }



例子结果分析
print char array : I am 中文编码
49 20 61 6d 20 4e2d 6587 7f16 7801
49 20 61 6d 20 4e2d 6587 7f16 7801
ISO-8859-1:
49 20 61 6d 20 3f 3f 3f 3f
GB2312:
49 20 61 6d 20 d6 d0 ce c4 b1 e0 c2 eb
GBK:
49 20 61 6d 20 d6 d0 ce c4 b1 e0 c2 eb
UTF-16:
fe ff 0 49 0 20 0 61 0 6d 0 20 4e 2d 65 87 7f 16 78 1
UTF-8:
49 20 61 6d 20 e4 b8 ad e6 96 87 e7 bc 96 e7 a0 81

ISO-8859-1是单字节编码,中文会转化成3f的byte。3f也就是“?”字符。所以出现中文编程“?”的时候很可能就是误用了ISO-8859-1。
GB2312和GBK字符集有一个从char到byte的码表,不同的字码就是从这个码表找到找到与每个字符对应的字节,然后拼装成byte数组。GBK的字符集>GB2312的字符集。所以GBK编码是兼容GB2312的编码的。
UTF-16将char数组放大了一倍。但字节字符在高位补0.
UTF-8对单字节字符仍用1个字节表示,对于汉字采用三个字节表示。

黑马基础测试题整理

package com.itheima; /** * 第1题: * 从键盘接受一个数字,打印该数字表示的时间,最大单位到天 例如: 键盘输入6,打印6秒 键盘输入60,打印1分 键盘输入66,打印...
  • hxysea
  • hxysea
  • 2014年02月12日 10:13
  • 1585

传智播客java就业班入学测试题(自测+答案)

---------------------- ASP.Net+Android+IOS开发、.Net培训、期待与您交流! ----------------------   传智播客java就业班...
  • dsa63
  • dsa63
  • 2013年11月11日 21:40
  • 3468

《黑马程序员》java笔记->HTML

------- android培训、java培训、期待与您交流! ---------- Html 内容 1. Html就是超文本标记语言的简写,是最基础的网页语言。 ...
  • bb175pt
  • bb175pt
  • 2013年06月16日 18:58
  • 430

黑马入学测试—基础—异常机制

异常机制已经成为判断一门编程语言是否成熟的标准,异常机制可以使程序中异常处理代码和正常业务代码分离,保证程序代码更加优雅,并提高程序健壮性。           Java异常机制主要依赖于t...
  • qq_25418233
  • qq_25418233
  • 2015年11月21日 00:20
  • 136

黑马入学测试—基础—Collection

/**          * Collection          *                 List(存取有序,有索引,可以重复)          *              ...
  • qq_25418233
  • qq_25418233
  • 2015年11月21日 00:22
  • 127

黑马入学测试—基础—集合

javauserliststringhashmapiterator   上图是集合框架中常用的类和接口:         一、用得最多的主...
  • qq_25418233
  • qq_25418233
  • 2015年10月29日 17:56
  • 139

【Unity】基础知识结构总结

本篇以知识结构图的形式对Unity引擎的常用基础知识内容进行了总结和梳理。 如果你学了一点关于Unity引擎的知识,又觉得太杂乱,那么希望本篇会给你一些帮助。 对应引擎版本:Unity 4.6.3 ...
  • lotusiki
  • lotusiki
  • 2015年07月25日 11:46
  • 2715

一张帖搞定同学们入学黑马前所有难题

前言:黑马程序员——上海校区,5月18日正式进驻上海,致力于打造华东最尖端的IT培训基地,解决目前华东IT人才紧缺矛盾。坚守黑马程序员“0元入学,10000元就业后,再给学费!”的郑重承诺,为同学们提...
  • yumei9
  • yumei9
  • 2015年06月09日 10:25
  • 1310

黑马入学测试一些比较难的题目

#import intadd(int p){        return (p++) + (++p);     }   inttest(int (*p)(int)){    retur...
  • wadeAD
  • wadeAD
  • 2016年04月30日 20:06
  • 2634

ps基础知识学习总结

不断的持续更新中。。。。。。。。。。。。。   套索工具:        磁性套索工具:按TAB变成圆形画笔,改变宽度,则对圆形笔头的半径大小进行控制。                    ...
  • duancanmeng
  • duancanmeng
  • 2012年03月19日 23:27
  • 3697
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:黑马入学测试—基础—中文编码知识总结
举报原因:
原因补充:

(最多只允许输入30个字)