C++11增加了Unicode字面量的支持,可以通过L来定义宽字符:
std::wstring str = L"中国人"; // 定义Unicode字符串
将宽字符串转换为窄字符串需要用的codecvt库种的std::wstring_convert。std::wstring_convert需要借助以下几个Unicode转换器:
- std::codecvt_utf8,封装了UTF-8与UCS2及UTF-8与UCS4的编码转换。
- std::codecvt_utf16,封装了UTF-8与UCS2及UTF-16与UCS4的编码转换。
- std::codecvt_utf8_utf16,封装了UTF-8与UTF-16的编码转换。
std::wstring_convert使std::string和std::wstring之间的转换变得很方便,如下代码:
#include <iostream>
#include <string>
#include <codecvt>
int main(void)
{
std::wstring str = L"我是中国人yzb";
std::wstring_convert<std::codecvt<wchar_t, char, std::mbstate_t>>
converter(new std::codecvt<wchar_t, char, std::mbstate_t>("CHS"));
std::string narrowStr = converter.to_bytes(str);
std::wstring wstr = converter.from_bytes(narrowStr);
std::cout << narrowStr << std::endl;
std::wcout.imbue(std::locale("chs")); //初始化cout为中文输出
std::wcout << wstr << std::endl;
system("pause");
return 0;
}