c++字符串编码GBK到UTF8的转换

使用c++跨windows和linux平台实现字符串GBK到UTF8的转换。

 原理是GBK字符串先转为unicode编码,然后再转换为UTF8编码。

代码如下:

#ifndef __CODE_CONVERT_H__
#define __CODE_CONVERT_H__
#include <cstdio>
#include <stdlib.h>  
#include <locale.h>  
#include <string>
#if defined(_WIN32) || defined(_WIN64)
#include <wtypes.h>
#endif
using namespace std;

//gbk字符串srcStr 转换为utf8字符串utfStr ,字符串utfStr的缓存最大大小 maxUtfStrlen
//失败返回-1,成功返回大于0 ,maxUtfStrlen的大小至少是源字符串有效长度大小2倍加1
inline int gbk2utf8(char *utfStr,size_t maxUtfStrlen,const char *srcStr)  
{  
	if(!srcStr||!utfStr)  
	{  
		printf("Bad Parameter\n");  
		return -1;  
	} 
#if defined(_WIN32) || defined(_WIN64)
	int len = MultiByteToWideChar(CP_ACP, 0, (LPCCH)srcStr, -1, NULL,0);
	unsigned short * strUnicode = new unsigned short[len+1];
	memset(strUnicode, 0, len * 2 + 2);
	MultiByteToWideChar(CP_ACP, 0, (LPCCH)srcStr, -1, (LPWSTR)strUnicode, len);
	len = WideCharToMultiByte(CP_UTF8, 0, (LPWSTR)strUnicode, -1, NULL, 0, NULL, NULL);
	if (len > (int)maxUtfStrlen)
	{
		printf("Dst Str memory not enough\n");
		delete[] strUnicode;
		return -1;
	}
	WideCharToMultiByte (CP_UTF8, 0, (LPWSTR)strUnicode, -1, utfStr, len, NULL,NULL);
	delete[] strUnicode;
	return len;
#else//linux
	//首先先将gbk编码转换为unicode编码
	if(NULL==setlocale(LC_ALL,"zh_CN.gbk"))//设置转换为unicode前的码,当前为gbk编码
	{  
		printf("参数有错误\n");
		return -1;  
	}  

	int unicodeLen=mbstowcs(NULL,srcStr,0);//计算转换后的长度
	if(unicodeLen<=0)  
	{  
		printf("不能转换!!!unicodeLen:(%d)\n",unicodeLen);
		return -1;  
	} 
	wchar_t *unicodeStr=(wchar_t *)calloc(sizeof(wchar_t),unicodeLen+1);  
	mbstowcs(unicodeStr,srcStr,strlen(srcStr));//将gbk转换为unicode
	//将unicode编码转换为utf8编码
	if(NULL==setlocale(LC_ALL,"zh_CN.utf8"))//设置unicode转换后的码,当前为utf8
	{  
		printf("参数有错误\n");
		free(unicodeStr);  
		return -1;  
	}  
	int utfLen=wcstombs(NULL,unicodeStr,0);//计算转换后的长度
	if(utfLen<=0)  
	{  
		printf("不能转换!!!utfLen:(%d)\n",utfLen);
		free(unicodeStr);
		return -1;  
	}  
	else if(utfLen>=(int)maxUtfStrlen)//判断空间是否足够
	{  
		printf("Dst Str memory not enough\n");
		free(unicodeStr);
		return -1;  
	}  
	wcstombs(utfStr,unicodeStr,utfLen);  
	utfStr[utfLen]=0;//添加结束符
	free(unicodeStr);  
	return utfLen;  
#endif
}
//gbk字符串srcStr 转换为utf8字符串target
inline int gbk2utf8(std::string& target,const char *srcStr)  
{
	if (!srcStr)
	{
		assert(false&&"string is empty");
	}
	int tarLen = (int)strlen(srcStr) * 2 + 1;
	char *tarStr = new char[tarLen];
	gbk2utf8(tarStr,tarLen - 1,srcStr);  
	target = tarStr;
	delete []tarStr;
	return tarLen;
}
#endif


  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值