字节(Byte):一个字节占8位(bit),在计算机和网络中是通过二进制字节传递信息的;
字符(character):字符是人所能读写的最小单位,例如汉字“我”、字母“A”、符合“+”等,计算机所能支持的字符组成的集合,就叫做字符集。
编码(encode):在计算机和网络中无法直接传递字符,所以需要将字符解析为字节,个解析操作就叫做编码(encode),而相应的,将编码的字节还原成字符的操作就叫做解码(decode)。编码和解码都需要按照一定的规则,这种把字符集中的字符编码为特定的二进制数的规则就是字符编码(Character encoding)。
编码的原因
由于人类的语言有太多,因而表示这些语言的符号太多,无法用计算机中一个基本的存储单元——字节 来表示,因而必须要经过拆分或一些翻译工作,才能让计算机能理解。计算机中存储信息的最小单元是一个字节即8个位(bit),所以能表示的字符范围是0~255个。人类要表示的符号太多,无法用一个字节来完全表示,这就需要编码来解决这个问题。
ASCII码
在计算机发展的早期,字符集和字符编码一般使用相同的命名,例如最早的字符集ASCII(American Standard Code fo