GBK、UTF8、UNICODE编码转换

最新推荐文章于 2022-03-30 11:43:17 发布

冰雪满天

最新推荐文章于 2022-03-30 11:43:17 发布

阅读量1k

点赞数

分类专栏： VC++ 文章标签： GBK、UTF8、UNICODE编码转换

VC++ 专栏收录该内容

62 篇文章 2 订阅

订阅专栏

string GBKToUTF8(const std::string& strGBK)
{
    int nLen = MultiByteToWideChar(CP_ACP, 0, strGBK.c_str(), -1, NULL, 0);
    WCHAR * wszUTF8 = new WCHAR[nLen];
    MultiByteToWideChar(CP_ACP, 0, strGBK.c_str(), -1, wszUTF8, nLen);

    nLen = WideCharToMultiByte(CP_UTF8, 0, wszUTF8, -1, NULL, 0, NULL, NULL);
    char * szUTF8 = new char[nLen];
    WideCharToMultiByte(CP_UTF8, 0, wszUTF8, -1, szUTF8, nLen, NULL, NULL);

    std::string strTemp(szUTF8);
    delete[]wszUTF8;
    delete[]szUTF8;
    return strTemp;
}

string UTF8ToGBK(const std::string& strUTF8)
{
    int nLen = MultiByteToWideChar(CP_UTF8, 0, strUTF8.c_str(), -1, NULL, 0);
    unsigned short * wszGBK = new unsigned short[nLen + 1];
    memset(wszGBK, 0, nLen * 2 + 2);
    MultiByteToWideChar(CP_UTF8, 0, strUTF8.c_str(), -1, (LPWSTR)wszGBK, nLen);

    nLen = WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, NULL, 0, NULL, NULL);
    char *szGBK = new char[nLen + 1];
    memset(szGBK, 0, nLen + 1);
    WideCharToMultiByte(CP_ACP,0, (LPWSTR)wszGBK, -1, szGBK, nLen, NULL, NULL);

    std::string strTemp(szGBK);
    delete[]szGBK;
    delete[]wszGBK;
    return strTemp;
}

std::string Gbk2Unicode(std::string &strValue)
{
    std::string strReturn;
    unsigned char chTemp;
    int nLength = strValue.length()*4+1;
    WCHAR *pwchBuf = new WCHAR[nLength];
    memset(pwchBuf, 0, sizeof(WCHAR) * nLength);

    MultiByteToWideChar(CP_ACP, 0, strValue.c_str(), -1, (LPWSTR)pwchBuf, nLength);

    for (size_t i = 0; i < wcslen(pwchBuf); i++)
    {
        strReturn += "\\u";
        chTemp = *((unsigned char*)pwchBuf+i*2+1);
        if(chTemp)
        {
            strReturn += m_clsmyOpenssl.char_to_hex( (unsigned char)(chTemp >> 4) );
            strReturn += m_clsmyOpenssl.char_to_hex( (unsigned char)(chTemp % 16) );
        }
        chTemp = *((unsigned char*)pwchBuf+i*2);
        strReturn += m_clsmyOpenssl.char_to_hex( (unsigned char)(chTemp >> 4) );
        strReturn += m_clsmyOpenssl.char_to_hex( (unsigned char)(chTemp % 16) );
    }
    delete[]pwchBuf;
    pwchBuf = NULL;
    return strReturn;
}

std::string Unicode2GBK(std::string &strValue)
{
    std::vector<std::string> vcString;
    MyTools::SplitString(strValue, "\\u", vcString);

    wchar_t* pwBuf = new wchar_t[strValue.length() + 1];
    memset(pwBuf, 0, (strValue.length() + 1)* sizeof(wchar_t));

    int j(0);

    for(std::vector<std::string>::iterator it = vcString.begin(); it != vcString.end(); ++it)
    {
        if (it->empty())
        {
            continue;
        }
        unsigned short wcTmp = 0;
        unsigned char cTmp = 0;

        //因为有中文字符混合ASSCII码情况,所以条件为k < it->length()
        for(size_t k = 0; k < it->length(); ++k)
        {
            cTmp = (unsigned char)(*it)[k];

            if(cTmp <= '9')//0x30~0x39 即0~9
            {
                wcTmp |= (cTmp & 0x0f) << (it->length() - k - 1) * 4;
            }
            else if(cTmp >= 'a')//0x61~7a 即a~z
            {
                wcTmp |= (cTmp - 0x57) << (it->length() - k - 1) * 4;
            }
            else//0x41~5a 即A~Z
            {
                wcTmp |= (cTmp - 0x37) << (it->length() - k - 1) * 4;
            }
        }
        pwBuf[j++] = (wchar_t)wcTmp;
    }
    char *pDst = new char[strValue.length() + 1];
    memset(pDst, 0, (strValue.length() + 1) * sizeof(char));

    WideCharToMultiByte(CP_ACP, 0, pwBuf, -1, (char*)pDst, strValue.length() - 1, NULL, NULL);
    std::string strRet(pDst);

    delete[]pwBuf;
    pwBuf= NULL;

    delete[]pDst;
    pDst=NULL;

    return strRet;
}