U8ToUnicode

CString U8ToUnicode(char* szU8) 
{ 
 //UTF8 to Unicode 
 //由于中文直接复制过来会成乱码,编译器有时会报错,故采用进制形式
 //ar* szU8 = "abcd1234\xe4\xbd\xa0\xe6\x88\x91\xe4\xbb\x96\x00"; 
 //预转换,得到所需空间的大小
 int wcsLen = ::MultiByteToWideChar(CP_UTF8, NULL, szU8, strlen(szU8), NULL, 0); 
 //分配空间要给'\0'留个空间,MultiByteToWideChar不会给'\0'空间
 wchar_t* wszString = new wchar_t[wcsLen + 1]; 
 //转换
 ::MultiByteToWideChar(CP_UTF8, NULL, szU8, strlen(szU8), wszString, wcsLen); 
 //最后加上'\0' 
 wszString[wcsLen] = '\0'; 
 CString strw(wszString);
 delete [] wszString;
 return strw;
 //写文本同ansi to unicode 
}

C++11 引入了对 Unicode 字符串的支持,包括以下几个方面: 1. Unicode 字符串字面值:使用前缀 u8、u、U、L 分别表示 UTF-8、UTF-16、UTF-32、宽字符编码的 Unicode 字符串字面值。 ```cpp // UTF-8 字符串字面值 const char* u8str = u8"Hello World!"; // UTF-16 字符串字面值 const char16_t* ustr = u"Hello World!"; // UTF-32 字符串字面值 const char32_t* Ustr = U"Hello World!"; // 宽字符编码的 Unicode 字符串字面值 const wchar_t* wstr = L"Hello World!"; ``` 2. Unicode 字符串类型:新增了名为 u16string 和 u32string 的字符串类型,分别代表 UTF-16 和 UTF-32 编码的 Unicode 字符串。 ```cpp #include <iostream> #include <string> int main() { // UTF-16 编码的 Unicode 字符串 std::u16string u16str = u"Hello World!"; // UTF-32 编码的 Unicode 字符串 std::u32string u32str = U"Hello World!"; std::cout << u16str << std::endl; std::cout << u32str << std::endl; return 0; } ``` 3. Unicode 编码转换:新增了头文件 <codecvt>,提供了 std::wstring_convert 类模板和 std::codecvt 类模板,用于在不同的编码之间进行转换。 ```cpp #include <iostream> #include <string> #include <codecvt> int main() { // UTF-16 编码的 Unicode 字符串 std::u16string u16str = u"Hello World!"; // 将 UTF-16 编码的字符串转换为 UTF-8 编码的字符串 std::wstring_convert<std::codecvt_utf8_utf16<char16_t>, char16_t> cvt; std::string utf8str = cvt.to_bytes(u16str); std::cout << utf8str << std::endl; return 0; } ``` 以上就是 C++11 对 Unicode 字符串的支持。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值