计算机最初只支持英文(包括标点符号),最先出现的字符编码是ASCII码(采用一个字节编码)
‘a’ ——>97(01100001)
‘A’——>65
‘0’——>48
‘a’——(按照ASCII码)——>01100001
0110001’——(按照ASCII码)——>‘a’
编码和解码的时候采用同一套字典/对照表,不会出现乱码
当解码和编码的时候采用的不是同一套对照表,会出现乱码问题
随着计算机的发展,后来出现了一种编码方式,是国际化标准组织ISO制定的,这种编码方式支持西欧语言,向上兼容ASCII码,仍然不支持中文。这种编码方式是:ISO-8859-1,又被称为latin-1
随着计算机向亚洲发展,计算机开始支持中文、日文、韩文等国家文字,其中支持简体中文的编码方式:GB2312<GBK<GB18030
支持繁体中文:大五码(big 5)
后来出现了一种编码方式统一了全球所有的文字,容量较大,这种编码方式叫做:unicode编码。unicode编码方式有多种具体的实现:UTF-8、UTF-16、UTF-32
java语言源代码采用的是unicode编码方式,所以“标识符”可以用中文
现在在实际开发中,一般采用UTF-8编码方式较多(统一编码方式)
类型 取值范围 默认值
byte -128 ~ 127 0
short -32768 ~ 32767 0
int -2147483648 ~ 2147483647 0
boolean true,false false(0)
char 0 ~ 65535 \u0000
注意:short和char所表示的种类总数是一样的,只不过char可以表示更大的正整数,因为char没有负数
一个中文占用2个字符,char类型正好是2个字节,所以java中的char类型变量可以存储一个中文字符