源文件编码方式

本文详细介绍了GCC和CL编译器如何处理不同编码方式的源文件,包括-GCC的-finput-charset、-fwide-exec-charset、-fexec-charset选项以及CL的自动识别机制。在GCC中,可以通过这些选项指定源文件、宽字符和窄字符的编码方式,而CL则固定使用ANSI和UTF-16编码。C++1x为应对编码混乱引入了新的字符串字面量表示法。
摘要由CSDN通过智能技术生成

"汉字"

GBK编码:BA BA , D7 D6

UTF-8编码:E6 B1 89, E5 AD 97

UTF-16BE编码:6C 49, 5B 57

 

两种常用编译器gcc,cl中对Unicode字面值的实现:

GCC

gcc中跟编码方式转换有关的三个编译选项:

  • -finput-charset=charset,此选项指定源文件本身的编码方式,默认为UTF-8(有无BOM均可)。例如当我们的源代码文件保存为GBK时,则也应当将此选项的值指定为GBK。
  • -fwide-exec-charset=charset,此选项指定宽字符或宽字符串的字面值常量的内部编码方式,默认为UTF-32或UTF-16,对应wchar_t的宽度。wchar_t的宽度依赖平台实现,windows 实现为2字节宽,linux 实现为4字节宽。例如指定此选项为GBK,则宽字符或宽字符串常量将会以GBK编码方式存储而不是默认的UTF-32或UTF-16编码方式。
  • -fexec-charset=charset,此选项指定窄字符或窄字符串的字面值常量的内部编码方式,默认为UTF-8。例如指定此选项为GBK,则窄字符或窄字符串常量将会以GBK编码方式存储而不是默认的UTF-8编码方式。

有了以上铺垫,下面两条语句的意义就很清楚了:

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值