c++ Unicode转UTF-8 & 宽字节转UTF8 & string转wstring & Utf8ToAnsi

本文介绍了C++中Unicode字符串如何转换为UTF-8,包括Unicode的char字符串直接转UTF-8,以及wchar_t和char之间的转换。重点讨论了在处理后台向网页传数据时可能出现的中文乱码问题,并提供了相关的代码片段。
摘要由CSDN通过智能技术生成

c++后台向网页传数据中文乱码
在这里插入图片描述

unicode的char字符串直接转UTF-8的char
网上找到有unicode转utf-8的代码,但是参数用的是wchar_t的. 不能直接用稍微改造一下
WideCharToMultiByte()函数需要Windows.h头文件

//原本的代码
//unicode转UTF-8
char* UnicodeToUtf8(wchar_t* pwszUnicode)
{
   
	int len;
	len = WideCharToMultiByte(CP_UTF8, 0, pwszUnicode, -1, NULL, 0, NULL, NULL);
	char* szUtf8 = (char*)malloc((int)len + 1);
	memset(szUtf8, 0, len + 1);
	WideCharToMultiByte(CP_UTF8, 0, pwszUnicode, -1, szUtf8, len, NULL, NULL);
	return szUtf8;
}

直接换成参数char*的

//unicode转UTF-8
char* UnicodeToUtf8(char* str)
{
   
	// 1. char转wchar_t
	wchar_t* pwszUnicode;
	int iSize;
	iSize = MultiByteToWideChar(CP_ACP, 0, str, -1, NULL, 0);
	pwszUnicode = (wchar_t*)malloc(iSize * sizeof(wchar_t));
	MultiByteToWideChar(CP_ACP, 0, str, -1, pwszUnicode, iSize);
	
  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
可以使用iconv库中的iconv函数将UTF-8编码的string类型换成Unicode编码的字节数组。具体步骤如下: 1. 引入iconv库头文件: ```c++ #include <iconv.h> ``` 2. 创建iconv_t类型的句柄: ```c++ iconv_t conv = iconv_open("UTF-32LE", "UTF-8"); ``` 其中,第一个参数是目标编码格式,第二个参数是源编码格式。本例中将UTF-8编码的string类型换成UTF-32LE编码的字节数组。 3. 定义源字符串和目标缓冲区: ```c++ std::string str = "Hello, 世界!"; char* src = const_cast<char*>(str.c_str()); size_t srclen = str.length(); char* dst = new char[srclen * 4]; // 缓冲区大小为源字符串长度的四倍(UTF-32编码下每个字符占4个字节) size_t dstlen = srclen * 4; ``` 4. 调用iconv函数进行换: ```c++ size_t res = iconv(conv, &src, &srclen, &dst, &dstlen); ``` 其中,第一个参数是iconv_t类型的句柄,第二个参数是源字符串的指针,第三个参数是源字符串的长度,第四个参数是目标缓冲区的指针,第五个参数是目标缓冲区的长度。 5. 关闭iconv句柄并释放资源: ```c++ iconv_close(conv); ``` 完整示例代码: ```c++ #include <iostream> #include <iconv.h> int main() { std::string str = "Hello, 世界!"; char* src = const_cast<char*>(str.c_str()); size_t srclen = str.length(); char* dst = new char[srclen * 4]; // 缓冲区大小为源字符串长度的四倍(UTF-32编码下每个字符占4个字节) size_t dstlen = srclen * 4; iconv_t conv = iconv_open("UTF-32LE", "UTF-8"); size_t res = iconv(conv, &src, &srclen, &dst, &dstlen); iconv_close(conv); std::cout << "换结果:" << std::endl; for (size_t i = 0; i < srclen * 4 - dstlen; i += 4) { uint32_t ch = *(reinterpret_cast<uint32_t*>(dst + i)); std::cout << std::hex << ch << " "; } std::cout << std::endl; delete[] dst; return 0; } ``` 注意:上述代码中的换结果是以16进制形式输出的字节数组,如果需要以Unicode字符串形式输出,可以在输出时将字节换成Unicode字符,或者使用std::wstring类型存储换结果。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值