UNICODE编码详解之UTF-8 , UTF-16,UTF-32
名词解释: Unicode只是一个简单的标准,用来把字符映射到数字上,Unicode并不告诉你字符是怎么编码成字节的。这是被编码方案决定的,通过UTF来指定。
文本数据在计算机底层的表示:
在计算机的硬盘,内存(等可以存储计算机数据的设备间)上数据都是以0和1表示的。比如这么一串在存储设备上的数据011010100010101010101010......如果它来自某个文本文件保存后的结果。
如何读懂它:
我们如何从这一串的0和1中从新解码得到一个个的字符呢?显然你需要把这一串的0和1分成一段一段的0和1。例如ASCII编码,他去翻译这些1和0的数据时它会把他们所有分成每组8位数据依次对照ASCII码表进行一一对应的译码,译码结束后请求计算机在屏幕上绘制出相应的字符,以便与使用者交流。