MultiByteToWideChar和WideCharToMultiByte用法详解

最新推荐文章于 2020-03-17 15:19:48 发布

xiaobai1593

最新推荐文章于 2020-03-17 15:19:48 发布

阅读量2.4w

点赞数 4

分类专栏：编码文章标签： translation wince null 语言 buffer delete

本文链接：https://blog.csdn.net/xiaobai1593/article/details/7382984

版权

编码专栏收录该内容

23 篇文章 0 订阅

订阅专栏

部分参考：

百度百科

http://blog.csdn.net/leitianjun/article/details/5605410

注意：

这两个函数是由Windows提供的转换函数，不具有通用性

C语言提供的转换函数为mbstowcs()/wcstombs()

一、函数简单介绍

涉及到的头文件：

函数所在头文件：windows.h

#include <windows.h>

wchar_t类型所需头文件：wchar.h

#include <wchar.h>

( 1 ) MultiByteToWideChar()

函数功能：该函数映射一个字符串到一个宽字符（unicode）的字符串。由该函数映射的字符串没必要是多字节字符组。

函数原型：

int MultiByteToWideChar(

　　UINT CodePage,

　　DWORD dwFlags,

　　LPCSTR lpMultiByteStr,

　　int cchMultiByte,

　　LPWSTR lpWideCharStr,

　　int cchWideChar

　　);

参数：

1> CodePage：指定执行转换的多字节字符所使用的字符集

这个参数可以为系统已安装或有效的任何字符集所给定的值。你也可以指定其为下面的任意一值：

Value	Description
CP_ACP	ANSI code page
CP_MACCP	Not supported
CP_OEMCP	OEM code page
CP_SYMBOL	Not supported
CP_THREAD_ACP	Not supported
CP_UTF7	UTF-7 code page
CP_UTF8	UTF-8 code page

2> dwFlags：一组位标记，用以指出是否未转换成预作或宽字符（若组合形式存在），是否使用象形文字替代控制字符，以及如何处理无效字符。你可以指定下面是标记常量的组合，含义如下：

　　MB_PRECOMPOSED：通常使用预作字符——就是说，由一个基本字符和一个非空字符组成的字符只有一个单一的字符值。这是缺省的转换选择。不能与MB_COMPOSITE值一起使用。

　　MB_COMPOSITE：通常使用组合字符——就是说，由一个基本字符和一个非空字符组成的字符分别有不同的字符值。不能与MB_PRECOMPOSED值一起使用。

　　MB_ERR_INVALID_CHARS：如果函数遇到无效的输入字符，它将运行失败，且GetLastErro返回ERROR_NO_UNICODE_TRANSLATION值。

　　MB_USEGLYPHCHARS：使用象形文字替代控制字符。

组合字符由一个基础字符和一个非空字符构成，每一个都有不同的字符值。每个预作字符都有单一的字符值给基础/非空字符的组成。在字符è中，e就是基础字符，而重音符标记就是非空字符。

标记MB_PRECOMPOSED和MB_COMPOSITE是互斥的，而标记MB_USEGLYPHCHARS和MB_ERR_INVALID_CHARS则不管其它标记如何都可以设置。

一般不使用这些标志，故取值为0时。

3> lpMultiByteStr：指向待转换的字符串的缓冲区。

4> cchMultiByte：指定由参数 lpMultiByteStr指向的字符串中字节的个数。可以设置为-1，会自动判断lpMultiByteStr指定的字符串的长度

（如果字符串不是以空字符中止，设置为-1可能失败，可能成功），此参数设置为0函数将失败。

5> lpWideCharStr：指向接收被转换字符串的缓冲区。

6> cchWideChar：指定由参数 lpWideCharStr指向的缓冲区的宽字节数。若此值为0，函数不会执行转换，而是返回目标缓存lpWideChatStr所需的宽字符数。

返回值：

如果函数运行成功，并且cchWideChar不为0，返回值是由lpWideCharStr指向的缓冲区中写入的宽字符数；

如果函数运行成功，并且cchMultiByte为0，返回值是待转换字符串的缓冲区所需求的宽字符数大小。（此种情况用来获取转换所需的wchar_t的个数）

如果函数运行失败，返回值为零。

若想获得更多错误信息，请调用GetLastError()函数。它可以返回下面所列错误代码：

　　ERROR_INSUFFICIENT_BUFFER； ERROR_INVALID_FLAGS；

　　ERROR_INVALID_PARAMETER； ERROR_NO_UNICODE_TRANSLATION。

( 2 ) WideCharToMultiByte()

函数功能：该函数映射一个unicode字符串到一个多字节字符串。

函数原型：

int WideCharToMultiByte(

　　UINT CodePage,

　　DWORD dwFlags,

　　LPCWSTR lpWideCharStr,

　　int cchWideChar,

　　LPSTR lpMultiByteStr,

　　int cchMultiByte,

　　LPCSTR lpDefaultChar,

　　LPBOOL pfUsedDefaultChar

　　);

参数：

与MultiByteToWideChar()函数中的参数类似，但是多了两个参数：

lpDefaultChar和pfUsedDefaultChar：只有当WideCharToMultiByte函数遇到一个宽字节字符，而该字符在uCodePage参数标识的代码页中并没有它的表示法时，WideCharToMultiByte函数才使用这两个参数。（通常都取值为NULL）

1> 如果宽字节字符不能被转换，该函数便使用lpDefaultChar参数指向的字符。如果该参数是NULL（这是大多数情况下的参数值），那么该函数使用系统的默认字符。该默认字符通常是个问号。这对于文件名来说是危险的，因为问号是个通配符。

2> pfUsedDefaultChar参数指向一个布尔变量，如果Unicode字符串中至少有一个字符不能转换成等价多字节字符，那么函数就将该变量置为TRUE。如果所有字符均被成功地转换，那么该函数就将该变量置为FALSE。当函数返回以便检查宽字节字符串是否被成功地转换后，可以测试该变量。

返回值：

如果函数运行成功，并且cchMultiByte不为零，返回值是由 lpMultiByteStr指向的缓冲区中写入的字节数；

如果函数运行成功，并且cchMultiByte为零，返回值是接收到待转换字符串的缓冲区所必需的字节数。（此种情况用来获取转换所需Char的个数）

如果函数运行失败，返回值为零。

若想获得更多错误信息，请调用GetLastError函数。它可以返回下面所列错误代码：

　　ERROR_INSUFFICIENT_BJFFER；ERROR_INVALID_FLAGS；

　　ERROR_INVALID_PARAMETER；ERROR_NO_UNICODE_TRANSLATION。

二、使用方法

( 1 ) 将多字节字符串转为宽字符串：

1) 调用MultiByteToWideChar()函数，设置cchWideChar参数为0（用以获取转换所需的接收缓冲区大小）；

2) 获取输入缓存的大小，作为cchMultiByte的值；（这样做是为了节省空间，也可以给cchMultiByte取值-1（字符串需要以空字符结尾，否则会出错））

3) 分配足够的内存块，用于存放转换后的Unicode字符串；

该内存块的大小由前面对cchWideChar()函数的返回值来决定；（也可以用别的方法，但该方法更节省内存）

4) 再次调用MultiByteToWideChar()函数，这次将缓存的地址作为lpWideCharStr,参数来传递，并传递第一次调用MultiByteToWideChar()函数时的返回值作为cchWideChar参数的值；

5) 使用转换后的字符串；

6) 释放接收缓冲区占用的内存块；

示例代码：

void main()
{
	char sBuf[25]={0};

	strcpy(sBuf, "我最棒");

	//获取输入缓存大小
	int sBufSize=strlen(sBuf);
	//获取输出缓存大小
	//VC++ 默认使用ANSI，故取第一个参数为CP_ACP
	DWORD dBufSize=MultiByteToWideChar(CP_ACP, 0, sBuf, sBufSize, NULL, 0);
	printf("需要wchar_t%u个\n", dBufSize);

	wchar_t * dBuf=new wchar_t[dBufSize];
	wmemset(dBuf, 0, dBufSize);

	//进行转换
	int nRet=MultiByteToWideChar(CP_ACP, 0, sBuf, sBufSize, dBuf, dBufSize);
	
	if(nRet<=0)
	{
		cout<<"转换失败"<<endl;
		DWORD dwErr=GetLastError();
		switch(dwErr)
		{
		case ERROR_INSUFFICIENT_BUFFER:
			printf("ERROR_INSUFFICIENT_BUFFER\n");
			break;
		case ERROR_INVALID_FLAGS:
			printf("ERROR_INVALID_FLAGS\n");
			break;
		case ERROR_INVALID_PARAMETER:
			printf("ERROR_INVALID_PARAMETER\n");
			break;
		case ERROR_NO_UNICODE_TRANSLATION:
			printf("ERROR_NO_UNICODE_TRANSLATION\n");
			break;
		}
	}
	else
	{
		cout<<"转换成功"<<endl;
		cout<<dBuf; 
	}

	delete(dBuf);
}

注意：两次调用MultiCharToWideChar()时，形参cchMultiByte的取值需要相同，否则可能会出现接收缓存不足之类的错误，从而导致转换失败！

( 2 ) 从宽字节转为窄字节字符串

步骤与（1）类似，故不赘述

代码示例如下：

	//从宽字符串转换窄字符串
	wchar_t sBuf[25]={0};
	wcscpy(sBuf, L"我最棒");

	//获取转换所需的目标缓存大小
	DWORD dBufSize=WideCharToMultiByte(CP_OEMCP, 0, sBuf, -1, NULL,0,NULL, FALSE);

	//分配目标缓存
	char *dBuf = new char[dBufSize];
	memset(dBuf, 0, dBufSize);

	//转换
	int nRet=WideCharToMultiByte(CP_OEMCP, 0, sBuf, -1, dBuf, dBufSize, NULL, FALSE);
	
	if(nRet<=0)
	{
		printf("转换失败\n");
	}
	else
	{
		printf("转换成功\nAfter Convert: %s\n", dBuf);
	}
	delete []dBuf;

三、MultiByteToWideChar()函数乱码的问题

有的朋友可能已经发现，在标准的WinCE4.2或WinCE5.0 SDK模拟器下，这个函数都无法正常工作，其转换之后的字符全是乱码！

及时更改MultiByteToWideChar()参数也依然如此。不过这个不是代码问题，其结症在于所定制的操作系统.如果我们定制的操作系统默认语言不是中文，也会出现这种情况。

由于标准的SDK默认语言为英文，所以肯定会出现这个问题。而这个问题的解决，不能在简单地更改控制面板的"区域选项"的"默认语言"，而是要在系统定制的时候，选择默认语言为"中文"。系统定制时选择默认语言的位置于: Platform -> Setting... -> locale -> default language ,选择"中文",然后编译即可。

xiaobai1593

关注

4
点赞
踩
22

收藏

觉得还不错? 一键收藏
1
评论
MultiByteToWideChar和WideCharToMultiByte用法详解

部分参考：百度百科http://blog.csdn.net/leitianjun/article/details/5605410注意：这两个函数是由Windows提供的转换函数，不具有通用性C语言提供的转换函数为mbstowcs()/wcstombs()一、函数简单介绍涉及到的头文件：函数所在头文件：windows.h#inc
复制链接

扫一扫