C++实现uft8和gbk编码字符串互相转换

在windows下用<windows.h>头文件里的函数进行多字节和宽字符转换,linux下采用<iconv.h>头文件里的函数进行编码互相解析。

#include <iostream>
#include <stdlib.h>
#include <string.h>
#include <string>

#ifdef _WIN32
#include <Windows.h>
#else
#include <iconv.h>
#endif

#ifdef _WIN32
std::string Utf8ToGbk(const char* src_str)
{
	std::string result;
	wchar_t* strSrc;
	char* szRes;
	int len = MultiByteToWideChar(CP_UTF8, 0, src_str, -1, NULL, 0);
	strSrc = new wchar_t[len + 1];
	MultiByteToWideChar(CP_UTF8, 0, src_str, -1, strSrc, len);

	len = WideCharToMultiByte(CP_ACP, 0, strSrc, -1, NULL, 0, NULL, NULL);
	szRes = new char[len + 1];
	WideCharToMultiByte(CP_ACP, 0, strSrc, -1, szRes, len, NULL, NULL);
	result = szRes;
	if(strSrc) 
		delete[]strSrc;
	if(szRes)
		delete[]szRes;
	return result;
}


std::string GbkToUtf8(const char* src_str)
{
	std::string result;
	wchar_t* strSrc;
	char* szRes;
	int len = MultiByteToWideChar(CP_ACP, 0, src_str, -1, NULL, 0);
	strSrc = new wchar_t[len + 1];
	MultiByteToWideChar(CP_ACP, 0, src_str, -1, strSrc, len);

	len = WideCharToMultiByte(CP_UTF8, 0, strSrc, -1, NULL, 0, NULL, NULL);
	szRes = new char[len + 1];
	WideCharToMultiByte(CP_UTF8, 0, strSrc, -1, szRes, len, NULL, NULL);
	result = szRes;
	if (strSrc)
		delete[]strSrc;
	if (szRes)
		delete[]szRes;
	return result;
}
#else
int code_convert(char *from_charset, char *to_charset, char *inbuf, size_t inlen, char *outbuf, size_t outlen)
{
	iconv_t cd;
	int rc;
	char **pin = &inbuf;
	char **pout = &outbuf;

	cd = iconv_open(to_charset, from_charset);
	if (cd == 0) return -1;
	memset(outbuf, 0, outlen);
	if (iconv(cd, pin, &inlen, pout, &outlen) == -1) return -1;
	iconv_close(cd);
	return 0;
}
int GbkToUtf8(char *inbuf, size_t inlen, char *outbuf, size_t outlen)
{
	return code_convert("gb2312", "utf-8", inbuf, inlen, outbuf, outlen);
}
int Utf8ToGbk(char *inbuf, size_t inlen, char *outbuf, size_t outlen)
{
	return code_convert("utf-8", "gb2312", inbuf, inlen, outbuf, outlen);
}
#endif

int main()
{
	std::string teststr = "测试字符串";
	std::cout << "原始字符串:" << teststr.c_str() << std::endl;
#ifdef _WIN32
	std::cout << Utf8ToGbk(GbkToUtf8(teststr.c_str()).c_str()) << std::endl;
#else
	char result_g[1024];
	GbkToUtf8((char*)teststr.c_str(), strlen(teststr.c_str()), result_g, 1024);
	char result_u[1024];
	Utf8ToGbk(result_g, strlen(result_g), result_u, 1024);
	std::cout << result_g << std::endl;
	std::cout << result_u << std::endl;
#endif
	return 0;
}
  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
字符串转为UTF-8编码需要使用一种称为"编码"的算法。C语言提供了一些函数和库来实现这个过程。以下是一个基本的C语言示例程序,用于将字符串转换为UTF-8编码。 ```c #include <stdio.h> #include <stdlib.h> #include <string.h> // 将字符串转为UTF-8编码 unsigned char* convertToUTF8(const char* str) { int unicodeLen = strlen(str); int utf8Len = 0; // 计算UTF-8编码需要的字节长度 for (int i = 0; i < unicodeLen; i++) { if (str[i] >= 0 && str[i] <= 0x7F) { utf8Len++; } else if (str[i] >= 0x80 && str[i] <= 0x7FF) { utf8Len += 2; } else { utf8Len += 3; } } // 分配UTF-8字符串内存 unsigned char* utf8Str = (unsigned char*)malloc(utf8Len + 1); utf8Str[utf8Len] = '\0'; // 转换为UTF-8编码 int idx = 0; for (int i = 0; i < unicodeLen; i++) { if (str[i] >= 0 && str[i] <= 0x7F) { utf8Str[idx++] = (unsigned char)str[i]; } else if (str[i] >= 0x80 && str[i] <= 0x7FF) { utf8Str[idx++] = (unsigned char)(((str[i] >> 6) & 0x1F) | 0xC0); utf8Str[idx++] = (unsigned char)((str[i] & 0x3F) | 0x80); } else { utf8Str[idx++] = (unsigned char)(((str[i] >> 12) & 0x0F) | 0xE0); utf8Str[idx++] = (unsigned char)(((str[i] >> 6) & 0x3F) | 0x80); utf8Str[idx++] = (unsigned char)((str[i] & 0x3F) | 0x80); } } return utf8Str; } int main() { const char* str = "字符串"; unsigned char* utf8Str = convertToUTF8(str); printf("UTF-8编码: %s\n", utf8Str); free(utf8Str); return 0; } ``` 以上代码实现了一个名为"convertToUTF8"的函数,该函数将接收一个字符串作为输入,并返回一个unsigned char指针,该指针指向转换为UTF-8编码字符串。在示例的"main"函数中,我们将字符串"字符串"传递给"convertToUTF8"函数,并打印出转换后的UTF-8编码字符串。 请注意,该示例仅仅是转换字符串为UTF-8编码的基本实现,并未考虑其他特殊情况和错误处理。在实际应用中,可能需要进行更全面和严谨的实现

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值