发展史:
ASCII–>GBK–>UNICODE–>UTF-8
最开始由美国发明ascii
计算机是二进制
ascii表有255个字符
所以最后的一个也就只是255
二进制数:11111111 转为十进制为256
所以设定八个二进制数为一个字节,代表一个字符
8bit=1bytes 字节,代表 1个字符
1024字节=1kb
1024kb = 1Mb
后来发展到中国,中国常用的汉字就有很多
八个字节远远不够代表所有汉字
于是中国发明了gbk,16个二进制数代表一个字符,
这就是为什么一个汉字占两个字节
但是同时一个字母也是占两个字节,浪费了内存空间
全世界发展,都有各自的规则,联合国发明unicode 方便各国交流 每个国家的字符都能识别
为了减少不必要的浪费,发明了utf-8
是汉字就占两个字节
是字母就占一个字节