字符编码笔记:ASCII,Unicode 和 UTF-8
细说:Unicode, UTF-8, UTF-16, UTF-32, UCS-2, UCS-4
- 总结
(1) 简单地说:Unicode属于字符集,不属于编码,UTF-8、UTF-16等是针对Unicode字符集的编码。
(2) UTF-8、UTF-16、UTF-32、UCS-2、UCS-4对比:
对比 UTF-8 UTF-16 UTF-32 UCS-2 UCS-4
编码空间 0-10FFFF 0-10FFFF 0-10FFFF 0-FFFF 0-7FFFFFFF
最少编码字节数 1 2 4 2 4
最多编码字节数 4 4 4 2 4
是否依赖字节序 否 是 是 是 是
参考:
维基百科:Unicode(中文版)
维基百科:Universal Coded Character Set(中文版)
维基百科:UTF-8(中文版)
维基百科:UTF-16(中文版)
维基百科:UTF-32(中文版)
FAQ: UTF-8, UTF-16, UTF-32 & BOM
Unicode 8.0 Character Code Charts
CJK Unified Ideographs (Han)
阮一峰:字符编码笔记:ASCII,Unicode和UTF-8
UCS vs UTF-8 as Internal String Encoding
本系列文章包括:
ANSI是什么编码?
汉字编码:GB2312, GBK, GB18030, Big5
细说:Unicode, UTF-8, UTF-16, UTF-32, UCS-2, UCS-4
转载请注明出处:http://www.cnblogs.com/malecrab/p/5300503.html