win32字节+编码处理

最新推荐文章于 2023-01-15 15:03:45 发布

Helius_Sun

最新推荐文章于 2023-01-15 15:03:45 发布

阅读量2.1k

点赞数 9

分类专栏： windows音频文章标签： win32 UTF-8转GDK char转wchar

本文链接：https://blog.csdn.net/helius_sun/article/details/44159297

版权

windows音频专栏收录该内容

3 篇文章 0 订阅

订阅专栏

VS2012用的编码格式是GBK，若要用默认UTF-8的工具与VS2012下的C++进行通讯，会出现乱码现象。网上常说的是在文件中选择高级保存选项，然后选择相应编码即可，事实证明，纯属扯淡，这样做了仍然是GBK格式。唯一好用的方法是在VS2012对接收到的UTF-8字符串进行处理。可以参考这篇文章，里面有详细代码：点击打开链接。里面有个小错误，虽然上面有解答，但我这里还是贴一下改过来的代码吧。

UTF-8为Unicode的表示方式，编码原则有两条：点击打开链接

1）对于单字节的符号，字节的第一位设为0，后面7位为这个符号的unicode码。因此对于英语字母，UTF-8编码和ASCII码是相同的。

2）对于n字节的符号（n>1）,第一个字节的前n位都设为1，第n+1位设为0，后面字节的前两位一律为10。剩下的没有提及的二进制位，全部为这个符号的unicode码。

//单字节UTF-8 转 Unicode -->UTF-8是一种存储方式Unicode是实际的二进制大小，因此需要先转化成unicode
int cU8xU(wchar_t* pOut,char *pText)
{
	int ret = 0; 
	char* uchar = (char *)pOut; 
	unsigned cIn = (unsigned char)pText[0]; 
	if(cIn<0x80){ // ASCII 0x00 ~ 0x7f 
		pOut[0] = pText[0]; 
	}else if(cIn<0xdf){ 
		uchar[0] = (pText[0]<<6)|(pText[1]&0x3f); 
		uchar[1] = (pText[0]>>2)&0x0f; 
		ret = 1; 
	}else if(cIn<=0xef){ 
		uchar[0] = (pText[1]<<6)|(pText[2]&0x3f); 
		uchar[1] = (pText[0]<<4)|((pText[1]>>2)&0x0f); 
		ret = 2; 
	}else if(cIn<0xf7){ 
		uchar[0] = (pText[2]<<6)|(pText[3]&0x3f); 
		uchar[1] = (pText[1]<<4)|((pText[2]>>2)&0x0f); 
		uchar[2] = ((pText[0]<<2)&0x1c)|((pText[1]>>4)&0x03); 
		ret = 3; 
	} 
	return ret; 
}

//单字节Unicod转GBK
int cUxG(char* pOut,WCHAR* pText){ 
	int ret = 0; 
    if(pText[0]<0x80){        // ASCII  0x00 ~ 0x7f 
		pOut[0] = (char)pText[0]; 
    }else{ 
		::WideCharToMultiByte(CP_ACP,0,pText,1,pOut,sizeof(WCHAR),NULL,NULL); 
        ret = 1; 
    } 
    return ret; 
}

//字符串UTF-8转GBK
 int sU8xG(char* pOut,char* pText,int Len){ 
	int i,j; 
	WCHAR buf; 
	for(i=0,j=0;i<Len;i++,j++){ 
		if((unsigned)pText[i]<0x80){ // ASCII 0x00 ~ 0x7f 
			pOut[j] = pText[i]; 
		}else{ 
			i += cU8xU(&buf,&pText[i]); 
			j += cUxG(&pOut[j],&buf); 
		} 
	} 
	return j; 
}

此外，贴一段char转wchar代码，代码是在网上找到的，出处忘记了，抱歉！

wchar_t* CharToWchar(const char* c)  
{  
   wchar_t *m_wchar;
    int len = MultiByteToWideChar(CP_ACP,0,c,strlen(c),NULL,0);  
    m_wchar=new wchar_t[len+1];  
    MultiByteToWideChar(CP_ACP,0,c,strlen(c),m_wchar,len);  
    m_wchar[len]='\0';  
    return m_wchar;  
}

Helius_Sun

关注

9
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
win32字节+编码处理

VS2012用的编码格式是GDK，若要用默认UTF-8的工具与VS2012下的C++进行通讯，会出现乱码现象。网上常说的是在文件中选择高级保存选项，然后选择相应编码即可，事实证明，纯属扯淡，这样做了仍然是GDK格式。唯一好用的方法是在VS2012对接收到的UTF-8字符串进行处理。至于处理方式我也不是很懂，就不班门弄斧了，可以参考这篇文章，里面有详细代码：点击打开链接。里面有个小错误，虽然上面有
复制链接

扫一扫