第三章变量和数据类型_C语言到底使用什么编码？

最新推荐文章于 2022-02-20 16:13:06 发布

happy 天堂

最新推荐文章于 2022-02-20 16:13:06 发布

阅读量825

点赞数 1

分类专栏： C语言重难点文章标签： c语言开发语言后端

本文链接：https://blog.csdn.net/qq_43205256/article/details/123004911

版权

本文探讨了C语言中变量和数据类型的编码问题。C语言的窄字符使用ASCII编码，但窄字符串的编码取决于操作系统和编译器，现代系统常采用UTF-8。wchar_t类型的宽字符和宽字符串则使用UTF-16或UTF-32编码。源文件通常推荐使用UTF-8编码以兼容ASCII并支持全球字符。不同的编译器对窄字符串的处理方式不同，微软编译器使用本地编码，而GCC和LLVM/Clang则采用源文件编码。理解这些编码差异对于深入学习C语言至关重要。

摘要由CSDN通过智能技术生成

C语言是 70 年代的产物，那个时候只有 ASCII，各个国家的字符编码都还未成熟，所以C语言不可能从底层支持 GB2312、GBK、Big5、Shift-JIS 等国家编码，也不可能支持 Unicode 字符集。

稍微有点C语言基本功的读者可能认为C语言使用 ASCII 编码，字符在存储时会转换成对应的 ASCII 码值，这也是错误的，你被大学老师和教材误导了！在C语言中，只有 char 类型的窄字符才使用 ASCII 编码，char 类型的窄字符串、wchar_t 类型的宽字符和宽字符串都不使用 ASCII 编码！

wchar_t 类型的宽字符和宽字符串使用 UTF-16 或者 UTF-32 编码，这个在上节已经讲到了，现在只剩下 char 类型的窄字符串（下面称为窄字符串）没有讲了，这就是本节的重点。

对于窄字符串，C语言并没有规定使用哪一种特定的编码，只要选用的编码能够适应当前的环境即可，所以，窄字符串的编码与操作系统和编译器有关。

但是，可以肯定的说，在现代计算机中，窄字符串已经不再使用 ASCII 编码了，因为 ASCII 编码只能显示字母、数字等英文字符，对汉语、日语、韩语等其它地区的字符无能为力。

讨论窄字符串的编码要从以下两个方面下手。