C++ Unicode与UTF_8 编码转换

原创 2016年05月31日 13:17:06
void UTF_8ToUnicode(wchar_t* pOut,char *pText){
    char* uchar = (char *)pOut;
    uchar[1] = ((pText[0] & 0x0F) << 4) + ((pText[1] >> 2) & 0x0F);
    uchar[0] = ((pText[1] & 0x03) << 6) + (pText[2] & 0x3F);
}

void UnicodeToUTF_8(char* pOut,wchar_t* pText){
    // 注意 WCHAR高低字的顺序,低字节在前,高字节在后
    char* pchar = (char *)pText;
    pOut[0] = (0xE0 | ((pchar[1] & 0xF0) >> 4));
    pOut[1] = (0x80 | ((pchar[1] & 0x0F) << 2)) + ((pchar[0] & 0xC0) >> 6);
    pOut[2] = (0x80 | (pchar[0] & 0x3F));
}

出处:

http://www.360doc.com/content/13/0114/20/7023119_260175036.shtml

以上代码只能转换第一个宽字符,要转换全部可以加一个循环,如下:

string UnicodeToUTF_8(wchar_t* pText)
{
    // 注意 WCHAR高低字的顺序,低字节在前,高字节在后
    string str;
    char* pOut = new char[4];
    memset(pOut, 0, 4);
    for (int i = 0; i < wcslen(pText); i ++) {
        char* pchar = (char *)&pText[i];

        pOut[0] = (0xE0 | ((pchar[1] & 0xF0) >> 4));
        pOut[1] = (0x80 | ((pchar[1] & 0x0F) << 2)) +((pchar[0] & 0xC0) >> 6);
        pOut[2] = (0x80 | (pchar[0] & 0x3F));

        str += pOut;
    }
    return str;
}

还可以使用 iconv库。

版权声明:本文为博主原创文章,未经博主允许不得转载。

Windows下字符编码转换(ANSI <--> Unicode <--> UTF-8)

摘自https://github.com/JoyLeeSoft/StringConverter,感谢JoyLeeSoft的分享。 主要实现windows平台下ANSI、Unicode、UTF-8编...

VBS和ASP中的各种编码转换GB2312、UTF-8、Unicode、URL解码、二进制、十进制代码、十六进制

'UTF转GB---将UTF8编码文字转换为GB编码文字 function UTF2GB(UTFStr) for Dig=1 to len(UTFStr) '如果UTF8编码文字以%开头...
  • wqsys
  • wqsys
  • 2012年07月21日 10:11
  • 2886

不依赖任何系统API,用c语言实现gbk/utf8/unicode编码转换

汉字'我' Unicode编码是 0x6211       01100010 00010001 UTF8编码是    0xe68891    11100110 10001000 100010001 ...

[参考资料] PB中字符编码转换[ansi, UTF8, Unicode]

[参考资料] PB中字符编码转换[ansi, UTF8, Unicode]

批量文件编码转换(GBK/UTF-8/UNICODE etc)

批量文件编码转换,JAVA源码:代码中的GBK为文件编码格式,Unicode为目标文件存储格式,根据个人实际情况切换编码。 warn:因为文件是一次性读取全部字符,所以单个文件大小不要太大,否则会内存...
  • crslee
  • crslee
  • 2016年09月30日 11:20
  • 1248

python编码转换__&__UNICODE,GBK,UTF-8区别

转载自:http://blog.csdn.net/uestcyao/article/details/7914935 python编码转换 python 编码转换 主要介绍了python的编码机...

Android NDK的C/C++代码中利用JNI回调实现字符编码转换的试验(中文UTF8与GBK)

在NDK下做网络传输时,遇到一个编码转换的问题,就是对方传过来的文件名是中文GBK编码,需要转成UTF8来处理。 平常在C/C++环境下编程时,系统都会提供字符编码转换的API。如Windows下有M...
  • huzgd
  • huzgd
  • 2011年02月14日 00:17
  • 8443

GBK(GB2312)向UTF-8的编码转换 -- C++

转:http://hi.baidu.com/ilotus_y/blog/item/aec98cf32e4f6c55342accf3.html GBK(GB2312)向UTF-8的编码...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:C++ Unicode与UTF_8 编码转换
举报原因:
原因补充:

(最多只允许输入30个字)