在C++中,std::string只是一个容器,其编码类型是可以不固定的,在不同的操作系统下,字符串的编码类型有很多种,只有在知道其编码类型后,输出才不会出现乱码,以下是几种不同编码类型互相转换的方法。
需要引入
#include<Windows.h>
同时设置本地化环境,以下是根据系统的默认区域设置来设置程序的本地化环境
setlocale(LC_ALL, "");
UTF16转GBK
std::string Utf16ToGBK(const wchar_t* wp)
{
int len = WideCharToMultiByte(CP_ACP, 0, wp, -1, nullptr, 0, nullptr, nullptr);
if (len <= 0) {
// 错误处理
return "";
}
std::vector<char> m_char(len);
WideCharToMultiByte(CP_ACP, 0, wp, -1, &m_char[0], len, nullptr, nullptr);
return std::string(m_char.begin(), m_char.end() - 1); // 删除尾部的空字符
}
GBK转UTF16
std::wstring GBKToUtf16(const char* c)
{
size_t m_encode = CP_ACP;
std::wstring str;
int len = MultiByteToWideChar(m_encode, 0, c, strlen(c), NULL, 0);
wchar_t* m_wchar = new wchar_t[len + 1];
MultiByteToWideChar(m_encode, 0, c, strlen(c), m_wchar, len);
m_wchar[len] = '\0';
str = m_wchar;
delete[] m_wchar;
return str;
}
UTF8转UTF16
std::wstring Utf8ToUtf16(const std::string& str)
{
if (str.empty()) return {};
int sizeNeeded = MultiByteToWideChar(CP_UTF8, 0, &str[0], (int)str.size(), nullptr, 0);
std::wstring wstrTo(sizeNeeded, 0);
MultiByteToWideChar(CP_UTF8, 0, &str[0], (int)str.size(), &wstrTo[0], sizeNeeded);
return wstrTo;
}
UTF16转UTF8
std::string Utf16ToUtf8(const std::wstring& utf16str)
{
if (utf16str.empty()) {
return std::string();
}
// 获取转换后的长度(以字符为单位,不包括null终止符)
int bytesRequired = WideCharToMultiByte(CP_UTF8, 0, utf16str.data(), static_cast<int>(utf16str.size()), NULL, 0, NULL, NULL);
if (bytesRequired <= 0) {
return std::string();
}
// 分配足够长度的std::string
std::string utf8str(bytesRequired, '\0');
// 执行转换
int result = WideCharToMultiByte(CP_UTF8, 0, utf16str.data(), static_cast<int>(utf16str.size()), utf8str.data(), bytesRequired, NULL, NULL);
if (result == 0) {
return std::string();
}
return utf8str;
}