Linux默认使用的是UTF-8格式文件,所以有时候将Linux下编辑保存后的文件在Windows下查看会发现有乱码。
在一些对编码格式有要求的场合,一定要注意使用正确的编码方式,比如字符叠加等场合,这个坑我是真的踩过的。
使用UTF-8格式编码的源码文件,默认保存为UTF-8格式
使用gcc编译,默认保存的格式为UTF-8。
#include <stdio.h>
int main(int argc, const char *argv[])
{
int i = 0;
unsigned char *str="abc中";
while (str[i])
{
printf("%02X ", str[i]);
i++;
}
printf("\n");
return 0;
}
gcc utf-8.c -o utf-8
测试结果
gcc编译器可以指定输入的编码格式和输出文件的编码格式
输入编码格式: -finput-charset=charset 表示源文件的编码方式, 默认以UTF-8来解析
-fexec-charset=charset 表示可执行程序里的字时候以什么编码方式来表示,默认是UTF-8
源文件为GB2312格式编码,通过gcc指定的输入输出,生成UTF-8格式的ELF文件
gcc -finput-charset=GBK -fexec-charset=UTF-8 -o ansi ansi.c
gcc -o ansi_orig ansi.c