计算机的世界只有0和1.人类世界是很丰富的。
最早人们使用计算机时,硬件机器语言:0000000111110000011111
后来。为了使用计算机的人方便,开始引入了助记符,可以表示更丰富的字符等信息
ASCII码:数字十进制65表示字符A,计算机底层把65十进制再转换为二进制,
最早的时候 ASCII码只能表示128个字符,后来计算机不仅仅在美国了,会流传到其他国家。
各个国家在ASCII码上扩展了128个,变成了256个了,但是后面扩展的128个不具有通用性。甚至计算机传入亚洲,就开始出现多字节编码。
例如:中国GB2312,h后来的GBK,台湾等地区的Big5等
越来越多字符编码的出现 ,使得各国之间的文档交流出现问题。
计算机希望在全国范围能够无障碍的交流,开始引入万国码,Unicode编码表。使用它的规则表示全世界所有的字符,每一个字符都有自己唯一的编码。这个数字范围跨度很大。
其中有1个字节的,2个字节的,3个字节的4个字节的等在网络传输时出现问题,为了解决这个问题,出现了UTF-8等编码方式,规定了到底几个字节是一个字符。