C++下的字符集转换/宽窄字符转换/UTF-GBK转换

前言

使用C++做开发时,经常需要用到编码字符转换。比如,Windows下,为了多语言的支持,API调用一般都推荐采用宽字节API(即W后缀API),但是在使用类似tinyXML,JSON解析等三方库的时候,有只能使用窄字节字符串。又或者在本地使用API获取到的为GBK或UTF16字符串,而通过网络向服务器传输数据时,有需要使用UTF8字符串等,都需要用到字符集转换。

基本概念

  • UTF16编码字符集:即UNICODE字符集,Windows下使用宽字节API读取到的字符串,就是UTF16编码。UTF16编码每个英文字符占用2个字节,中文字符则固定占用4个。UTF16在VS编译器中,直接使用wchar_t定义即可。
  • UTF8编码字符集:单字节字符串,每个英文字符占1个字节,而中文字符会占用2~4个字节不等。
  • GBK编码字符集:Windows下使用窄字节API读取到的字符串就是GBK编码。每个英文字符占用1个字节,中文字符占用字节数不等。GBK也是广义字符集,包含GB2312,GB18030等。
  • ANSI编码:编码标准。确切的说并不是字符集。在不同操作系统上,ANSI可能会使用不同的字符集。在大部分中文简体操作系统上,ANSI使用的是GB2312编码字符集。
  • 代码页:WIndows为兼容新旧程序的不同而加入。不同系统上代码页可能不同,甚至同一操作系统下,不同的应用程序使用的代码页也可能个不同。编程时,可以使用GetACP获取当前代码页标识。

使用boost库进行字符编

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值