名称 | 意思 |
ASCII | 美国标准信息交换码 |
BMP | 基本多文种平面(第零平面) |
BOM | 字节顺序标记(标识字节顺序的字符) |
CJK/CJKW | 中文-日文-韩文(和越南语)的缩写 |
Code point | 类似于 ASCII 值,代表 Unicode 字符的值,范围在 range(1114112)或者说0x000000 到 0x10FFFF. |
Octet | 八位二进制数的位组 |
UCS | 通用字符集 |
UCS2 | UCS 的双字节编码方式(见 UTF-16) |
USC4 | UCS 的四字节编码方式 |
UTF | Unicode 或者 UCS 的转换格式. |
UTF-8 | 八位 UTF 转换格式(无符号字节序列, 长度为一到四个字节) |
UTF-16 | 16 位 UTF 转换格式(无符号字节序列,通常是 16 位长[两个字节],见 UCS2) |
python术语(Unicode)
最新推荐文章于 2021-03-02 01:17:12 发布