编码表:其实就是生活中文件和计算机二进制的对应关系表
字符码表
ISO8859-1:拉丁码表,兼容ASCII,还包括了西欧语言,希腊语,泰语,阿拉伯语等
GBK:兼容GB2312,包含更多中文,每个英文占1个字节,中文占2个字节(第一个字节为负数,第二个字节为可正可负)
Unicode:国际标准码,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,每个字符占2个字节。java中存储字符类型就是使用Unicode编码
UTF-8:是针对Unicode的可变长编码,可以用来表示Unicode标准中的任何字符,其中,英文占1个字节,中文占3个字节,这是程序开发中最常用的字符码表
编码:把字符串转换成计算机识别的字节序列称为编码。
解码:而把字节序列转换为普通人能看懂的明文字符串称为解码。