对各种字符集和字符编码的理解(Ansi,GB2312,Unicode,UCS,utf 8)

 1、Ansi:字符集 包括 Ascii,Gb2312,GBK,还有其他国家自己定义的字符集。GB2312 用两个字符表示一个中文字符,所以ansi编码下用strlen  时,一个中文字符为2.    而定义的这些Ansi字符集之间是冲突的,微软用代码页方式解决他们之间的冲突。所谓的内码和外码是指 全屏、五笔、微软拼音等与GB2312之间的关系。

2、Unicode:是字符集。采用2个字节表示世界上所以字符。 实现方式UTF-16小尾序(BOM)、UTF-16大尾序(BOM)和 UTF-8,对应window, 文本编辑器另存为的3中格式。可以用ue打开查看2进制编码。

 

3、在window中,用char表示ansi,wchar表示unicode宽字节。

 

4、ansi 和unicode 的转换可以用M u l t i B y t e To Wi d e C h a r之类的函数实现

 

5、ansi,gb2312,unicede既是字符集也是字符编码, 而utf8 是编码方式

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值