C语言字符编码问题探究（一）：源文件编码导致的问题

最新推荐文章于 2024-07-31 16:54:49 发布

码农哈里

最新推荐文章于 2024-07-31 16:54:49 发布

阅读量3.3k

点赞数 12

分类专栏： Windows C语言程序设计文章标签： C语言字符编码字符集 Windows

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/HarryDuanChina/article/details/90677842

版权

本文探讨了C语言源文件使用不同字符编码（GBK与UTF-8）时，如何影响程序输出。通过分析正常与不正常程序的输出，揭示了控制台的代码页设置对字符显示的重要性。当控制台代码页与源文件编码不匹配时，会导致字符显示异常，通过调整代码页设置可以解决此类问题。

摘要由CSDN通过智能技术生成

一、一个正常的C程序

第一步，在Windows 10环境下，使用Notepad++编写如下源代码，并保存到文件main.c当中。

#include <stdio.h>

int main(void)
{
    puts("China");
    puts("中国");
	
    return 0;
}

这段代码的意思，是在控制台输出两个字符串，一个是China，另一个是中国。

第二步，使用如下gcc（gcc 8.2.0，下同）命令编译上述源代码，生成可执行文件main.exe。

gcc main.c -o main.exe

第三步，运行刚刚生成的main.exe，输出结果如下。

China
中国

上述程序代码和输出结果如预期一般，一切正常。下面我们再来看一个程序。

二、一个“不正常”的C程序

第一步，在Windows 10环境下，使用Notepad++编写如下源代码，并保存到文件main.utf8.c当中。

#include <stdio.h>

int main(void)
{
    puts("China");
    puts("中国");
	
    return 0;
}

这段代码跟上面的程序代码完全相同。但是，跟上一个程序不同的是，这次保存文件main.utf8.c时选择的源文件字符集编码格式是UTF-8。

第二步，使用如下gcc命令编译上述源代码，生成可执行文件main.utf8.exe。

gcc main.utf8.c -o main.utf8.exe

第三步，运行刚刚生成的main.utf8.exe，输出结果如下。

China
涓浗

可以看到，这次的输出与上一个程序的输出不同。字符串China如预期一样正常输出了，但是中国这两个字并没有被输出，取而代之的是输出了涓浗这几个奇怪的字符。

同样的源代码，怎么源文件的字符编码不同，输出结果就不同了呢？

三、源文件的字符编码

既然是源文件编码不同导致了输出结果不同，那就首先来看一下两个源文件的内容

最低0.47元/天解锁文章

关注

12
点赞
踩
14

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

码农哈里 CSDN认证博客专家 CSDN认证企业博客

码龄17年

24: 原创

13万+: 周排名

83万+: 总排名

19万+: 访问

: 等级

1523: 积分

159: 粉丝

336: 获赞

41: 评论

475: 收藏

私信

关注

热门文章

分类专栏

最新评论

C语言中的转义字符\b的含义
CSL好好加油: 博主，我认为最后一个示例不是因为\b遇到\n，而是输出了\n换行了，在新行里输出后面的\b……，所以最后光标只能回退到新行的头部，根据您上面的解释，后面的89代替了已经显示的67，如我有理解不当之处，还请指正
在Ubuntu上安装MariaDB以及初步设置
CSDN-Ada助手: 非常感谢CSDN博主的分享，这篇博客对于想要在Ubuntu上安装MariaDB的读者来说非常有用。我觉得下一篇博客可以继续探讨MariaDB的具体使用，例如如何创建和管理数据库、如何进行数据备份和恢复等方面的内容。这样的技术文章对于想要深入了解MariaDB的读者非常有帮助。期待你的下一篇博客！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
C语言中的转义字符\b的含义
彭朝冕: printf("1234567\b\b\b\b89"); 结果为12389
C语言中的转义字符\b的含义
彭朝冕: 我用ubuntu 20.04的gcc编译，事实上\b 就是不能退到上一行的退格键，与楼主所述不一致
C语言中的转义字符\b的含义
Siren_dream: 我用的vs2022运行结果也是12389 7

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。