Unicode简单来说就是字符集,涵盖了世界上所有字符的一本“字典”。这些上百万的字符存储都是靠很多个1和0实现的即所谓的代码。
那么在计算机运行中,怎么智能地把字典中的文字代码翻译成我们熟知的文字语言呢,那么就需要“翻译工具”,UTF系列就是这样的编码“翻译工具”。
Unicode 可以使用的编码有三种,分别是:
UFT-8:一种变长的编码方案,使用 1~6 个字节来存储;
UFT-32:一种固定长度的编码方案,不管字符编号大小,始终使用 4 个字节来存储;
UTF-16:介于 UTF-8 和 UTF-32 之间,使用 2 个或者 4 个字节来存储,长度既固定又可变。
*只有 UTF-8 兼容 ASCII,UTF-32 和 UTF-16 都不兼容 ASCII,因为它们没有单字节编码。
对于Unicode,UTF系列的理解
最新推荐文章于 2023-10-06 13:43:01 发布