字符编码方式

本文详细介绍了几种常见的字符编码格式,包括ANSI、UTF-8、UTF-16-BE及UTF-16-LE,并对比了它们的特点。同时,还探讨了在使用不同编码的源文件时如何通过编译参数来解决输出不一致的问题。
摘要由CSDN通过智能技术生成

字符编码:

以"abc中"为示例:

 

ANSI:

 61 62 63 D6 D0

ASICII码使用一个字节,中文占用2个字节 

UTF-8:

EF BB BF 61 62 63 E4 B8 AD

变长,最常用!有容错性!

EF BB BF表示是UTF8

 

UTF-16-BE:

FE FF 00 61 00 62 00 63 4E 2D

FE FF表示大端,编码固定都使用2个字节

 

UTF-16-LE:

FF FE 61 00 62 00 63 00 2D 4E

FF FE表示小端,编码固定都使用2个字节

 

 

Man gcc

/charset

源文件用不同编码方式编写,会导致输出结果不一样

如何解决?

编译程序时,制定字符集

-finput-charset=xxx 表示源文件的编码方式,默认以UTF-8来解析

-fexec-charset=xxx  表示可执行程序里的字符以什么编码方式来表示,默认是UTF-8

 

gcc –finput-charset=GBK –fexec-charset=UTF-8 –o utf-8 ansi.c

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值