计算机只能识别二进制.
1byte=8bit,1字节=8比特.
1bit就是一个1或0.
byte b=2,在计算机中是这样表示的:00000010.
short s=2,在计算机中是这样表示的:00000000 00000010.以此类推.
字符编码是人为的定义的一套转换表.
在字符编码中规定了一系列的文字对应的二进制.
字符编码其实本质上就是一本字典,该字典中描述了文字与二进制之间的对照关系.
字符编码是人为规定的.
字符编码涉及到编码和解码两个过程,编码和解码的时候必须采用同一套字符编码方式,不然就会出现乱码.
ASCII码采用1byte进行存储,因为英文字母是26个.(键盘上所有的键全部算上也不超过256个,1byte可以存储256种不同的情况,所有英文本身在计算机方面就占有优势)
'a'所对应的ASCII码位97.
'A'所对应的ASCII码位65.
'0'所对应的ASCII码位48.
'a'---(采用ASCII码进行编码)->01100001
01100001--(采用ASCII码进行解码)->'a'.
如果编码和解码采用的不是同一个编码方式,会出现乱码.
国际标准组织制定了ISO-8859-1编码方式,又称为latin-1编码方式,向上兼容ASCII码,但不支持中文.
简体中文这块的编码方式:GB2312<GBK<GB18030(容量的关系)
繁体中文:big5(台湾使用的是大五码).
在java中,java为了支持全球所有的文字,采用了一种编码方式叫做unicode编码,unicode编码统一了全球所有的文字,支持所有文字,具体的实现包括utf-8,utf-16,utf-32...
ASCII表: