我所了解的GB2312、Unicode、GBK、UTF-8、BIG5等编码

本文链接：https://blog.csdn.net/Yangchenju/article/details/84196197

本文介绍了汉字编码的不同标准，包括GB2312、GBK、Unicode、UTF-8和BIG5。GB2312是基本的汉字编码，GBK在其基础上增加更多汉字。Unicode为全球文字统一编码，UTF-8是其变长字节表示方式。BIG5则主要应用于台湾和香港地区的繁体汉字编码。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

- - - - 1. GB2312
      - 2. GBK
      - 3. Unicode
      - 4. UTF-8
      - 5. BIG5

小编一直对文字编码感到模糊，在学习、编程等过程中也经常会遇到与之相关的问题，无奈只能问百度。于是，为解决这一问题，小编花了一些时日了解和学习这些编码，整理出了这些编码的“性格特点”，“兴趣爱好”等等（文章中可能不全面，接受建议）。
有关文章参见：趣谈unicode，ansi，utf-8，unicode big endian这些编码有什么区别。
在这之前，我得先提一下 ASCII码（American Standard Code for Information Interchange，美国信息交换标准代码）是基于拉丁字母的一套电脑编码系统，主要用于显示现代英语和其他西欧语言。它是现今 最通用的 单字节编码系统，并等同于国际标准ISO/IEC 646（ISO是国际字符集编码标准）。
在早期，人们用 8 位二进制来编码英文字母(最前面的一位是 0)，也就是说，将英文字母和一些常用的字符和这 128 中二进制 0、1 串一一对应起来，比如说大写字母“A”所对应的二进制位“01000001”，转换为十六进制为 41。在美国，这 128 是够了，但其他国家也需要计算机，也需要编码表示自己国家的文字&#x