VS2012用的编码格式是GBK,若要用默认UTF-8的工具与VS2012下的C++进行通讯,会出现乱码现象。网上常说的是在文件中选择高级保存选项,然后选择相应编码即可,事实证明,纯属扯淡,这样做了仍然是GBK格式。唯一好用的方法是在VS2012对接收到的UTF-8字符串进行处理。可以参考这篇文章,里面有详细代码:点击打开链接 。里面有个小错误,虽然上面有解答,但我这里还是贴一下改过来的代码吧。
UTF-8为Unicode的表示方式,编码原则有两条:点击打开链接
1)对于单字节的符号,字节的第一位设为0,后面7位为这个符号的unicode码。因此对于英语字母,UTF-8编码和ASCII码是相同的。
2)对于n字节的符号(n>1),第一个字节的前n位都设为1,第n+1位设为0,后面字节的前两位一律为10。剩下的没有提及的二进制位,全部为这个符号的unicode码。
//单字节UTF-8 转 Unicode -->UTF-8是一种存储方式Unicode是实际的二进制大小,因此需要先转化成unicode
int cU8xU(wchar_t* pOut,char *pText)
{
int ret = 0;
char* uchar = (char *)pOut;
unsigned cIn = (unsigned char)pText[0];
if(cIn<0x80){ // ASCII 0x00 ~ 0x7f
pOut[0] = pText[0];
}else if(cIn<0xdf){
uchar[0] = (pText[0]<<6)|(pText[1]&0x3f);
uchar[1] = (pText[0]>>2)&0x0f;
ret = 1;
}else if(cIn<=0xef){
uchar[0] = (pText[1]<<6)|(pText[2]&0x3f);
uchar[1] = (pText[0]<<4)|((pText[1]>>2)&0x0f);
ret = 2;
}else if(cIn<0xf7){
uchar[0] = (pText[2]<<6)|(pText[3]&0x3f);
uchar[1] = (pText[1]<<4)|((pText[2]>>2)&0x0f);
uchar[2] = ((pText[0]<<2)&0x1c)|((pText[1]>>4)&0x03);
ret = 3;
}
return ret;
}
//单字节Unicod转GBK
int cUxG(char* pOut,WCHAR* pText){
int ret = 0;
if(pText[0]<0x80){ // ASCII 0x00 ~ 0x7f
pOut[0] = (char)pText[0];
}else{
::WideCharToMultiByte(CP_ACP,0,pText,1,pOut,sizeof(WCHAR),NULL,NULL);
ret = 1;
}
return ret;
}
//字符串UTF-8转GBK
int sU8xG(char* pOut,char* pText,int Len){
int i,j;
WCHAR buf;
for(i=0,j=0;i<Len;i++,j++){
if((unsigned)pText[i]<0x80){ // ASCII 0x00 ~ 0x7f
pOut[j] = pText[i];
}else{
i += cU8xU(&buf,&pText[i]);
j += cUxG(&pOut[j],&buf);
}
}
return j;
}
此外,贴一段char转wchar代码,代码是在网上找到的,出处忘记了,抱歉!
wchar_t* CharToWchar(const char* c)
{
wchar_t *m_wchar;
int len = MultiByteToWideChar(CP_ACP,0,c,strlen(c),NULL,0);
m_wchar=new wchar_t[len+1];
MultiByteToWideChar(CP_ACP,0,c,strlen(c),m_wchar,len);
m_wchar[len]='\0';
return m_wchar;
}