字符编码是现实世界的文字与计算机语言的连接桥梁,现实世界中每一个文字或者字符都都有一串字符编码与其对应,当在计算机中输入这个文字时,系统会将其编译成字符编码供计算机识别使用。字符编码以数字的形式呈现,最终又将数字转化会二进制。
二进制是数据的一种表示形式。例如:十进制表示满十进一,八进制表示满八进一,同理二进制则为满二进一。
十进制:0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 。。。。。
二进制:0 1 10 11 100 101 110 111 1000 1001 1010 1011 1100 1101 1110 。。。。。
例如:
‘a’——> (97 ASCII编码)——>【01100001】
‘A’——> 65
‘0’——> 48
* 编码和解码时候采用的是同一套对照表,如果不是同一套编码,就会出现乱码状况。
- 首先被制定的计算机编译码为大家所熟知的ASCII码。
- 随着计算机的发展后来出现了一种编码方式,是国际化标准组织IOS制定的,这种编码方式支持西欧语言,向上兼容ASCII码,仍然不支持中午。这种编码方式是:ISO-8859-1,又被称为Latin-1。
- 随着计算机向亚洲发展,计算机开始支持中文、日文、韩文等国家文字,其中支持简体中文的编码方式: GB2312 / GBK / GB1830(按所包含文字容量排序)
- 支持繁体中文:大五码(big5)
- 后来出现统一全球文字的编码方式,容量较大,这种方式叫做Unicode编码包括的形式有:UTF-8 , UTF-16 , UTF-32
* java 采用的是Unicode编码方式所以类名可以用中文