MultiByteToWideChar和WideCharToMultiByte用法详解

MultiByteToWideChar和WideCharToMultiByte用法详解

分类: 编码 4166人阅读 评论(0) 收藏 举报

部分参考:

百度百科

http://blog.csdn.net/leitianjun/article/details/5605410

注意:

这两个函数是由Windows提供的转换函数,不具有通用性

C语言提供的转换函数为mbstowcs()/wcstombs()

一、函数简单介绍

涉及到的头文件:

函数所在头文件:windows.h

#include <windows.h>

wchar_t类型所需头文件:wchar.h

#include <wchar.h>

( 1 ) MultiByteToWideChar()

函数功能:该函数映射一个字符串到一个宽字符(unicode)的字符串。由该函数映射的字符串没必要是多字节字符组。 

函数原型: 

int MultiByteToWideChar(

  UINT CodePage,  DWORD dwFlags,  LPCSTR lpMultiByteStr,  int cchMultiByte,  LPWSTR lpWideCharStr,  int cchWideChar  );

参数:

1> CodePage:指定执行转换的多字节字符所使用的字符集

这个参数可以为系统已安装或有效的任何字符集所给定的值。你也可以指定其为下面的任意一值:

Value Description
CP_ACP ANSI code page
CP_MACCP Not supported
CP_OEMCP OEM code page
CP_SYMBOL Not supported
CP_THREAD_ACP Not supported
CP_UTF7 UTF-7 code page
CP_UTF8 UTF-8 code page
2> dwFlags:一组位标记,用以指出是否未转换成预作或宽字符(若组合形式存在),是否使用象形文字替代控制字符,以及如何处理无效字符。你可以指定下面是标记常量的组合,含义如下:
  MB_PRECOMPOSED:通常使用预作字符——就是说,由一个基本字符和一个非空字符组成的字符只有一个单一的字符值。这是缺省的转换选择。不能与MB_COMPOSITE值一起使用。   MB_COMPOSITE:通常使用组合字符——就是说,由一个基本字符和一个非空字符组成的字符分别有不同的字符值。不能与MB_PRECOMPOSED值一起使用。   MB_ERR_INVALID_CHARS:如果函数遇到无效的输入字符,它将运行失败,且GetLastErro返回ERROR_NO_UNICODE_TRANSLATION值。   MB_USEGLYPHCHARS:使用象形文字替代控制字符。 
组合字符由一个基础字符和一个非空字符构成,每一个都有不同的字符值。每个预作字符都有单一的字符值给基础/非空字符的组成。在字符è中,e就是基础字符,而重音符标记就是非空字符。 
标记MB_PRECOMPOSED和MB_COMPOSITE是互斥的,而标记MB_USEGLYPHCHARS和MB_ERR_INVALID_CHARS则不管其它标记如何都可以设置。 
一般不使用这些标志,故取值为0时。
3> lpMultiByteStr:指向 待转换的字符串的缓冲区。 
4> cchMultiByte:指定由参数 lpMultiByteStr指向的字符串中字节的个数。可以设置为-1,会自动判断lpMultiByteStr指定的字符串的长度
(如果字符串不是以空字符中止,设置为-1可能失败,可能成功),此参数设置为0函数将失败。 
5> lpWideCharStr:指向 接收被转换字符串的缓冲区。 
6> cchWideChar:指定由参数 lpWideCharStr指向的缓冲区的宽字节数。若此值为0,函数不会执行转换,而是返回目标缓存lpWideChatStr所需的宽字符数。
返回值:

如果函数运行成功,并且cchWideChar不为0,返回值是由lpWideCharStr指向的缓冲区中写入的宽字符数;

如果函数运行成功,并且cchMultiByte为0,返回值是待转换字符串的缓冲区所需求的宽字符数大小。(此种情况用来获取转换所需的wchar_t的个数)

如果函数运行失败,返回值为零。

若想获得更多错误信息,请调用GetLastError()函数。它可以返回下面所列错误代码:

  ERROR_INSUFFICIENT_BUFFER;     ERROR_INVALID_FLAGS;  ERROR_INVALID_PARAMETER;         ERROR_NO_UNICODE_TRANSLATION。
( 2 ) WideCharToMultiByte()

函数功能:该函数映射一个unicode字符串到一个多字节字符串。 

函数原型: 

int WideCharToMultiByte(

  UINT CodePage,  DWORD dwFlags,  LPCWSTR lpWideCharStr,  int cchWideChar,  LPSTR lpMultiByteStr,  int cchMultiByte,  LPCSTR lpDefaultChar,  LPBOOL pfUsedDefaultChar  );

参数:

与MultiByteToWideChar()函数中的参数类似,但是多了两个参数:

lpDefaultCharpfUsedDefaultChar:只有当WideCharToMultiByte函数遇到一个宽字节字符,而该字符在uCodePage参数标识的代码页中并没有它的表示法时,WideCharToMultiByte函数才使用这两个参数。(通常都取值为NULL)

1> 如果宽字节字符不能被转换,该函数便使用lpDefaultChar参数指向的字符。如果该参数是NULL(这是大多数情况下的参数值),那么该函数使用系统的默认字符。该默认字符通常是个问号。这对于文件名来说是危险的,因为问号是个通配符。

2> pfUsedDefaultChar参数指向一个布尔变量,如果Unicode字符串中至少有一个字符不能转换成等价多字节字符,那么函数就将该变量置为TRUE。如果所有字符均被成功地转换,那么该函数就将该变量置为FALSE。当函数返回以便检查宽字节字符串是否被成功地转换后,可以测试该变量。

返回值

如果函数运行成功,并且cchMultiByte不为零,返回值是由 lpMultiByteStr指向的缓冲区中写入的字节数;

如果函数运行成功,并且cchMultiByte为零,返回值是接收到待转换字符串的缓冲区所必需的字节数。(此种情况用来获取转换所需Char的个数)

如果函数运行失败,返回值为零。

若想获得更多错误信息,请调用GetLastError函数。它可以返回下面所列错误代码:

  ERROR_INSUFFICIENT_BJFFER;ERROR_INVALID_FLAGS;  ERROR_INVALID_PARAMETER;ERROR_NO_UNICODE_TRANSLATION。

二、使用方法

( 1 ) 将多字节字符串转为宽字符串:

1) 调用MultiByteToWideChar()函数,设置cchWideChar参数为0(用以获取转换所需的接收缓冲区大小);

2) 获取输入缓存的大小,作为cchMultiByte的值;(这样做是为了节省空间,也可以给cchMultiByte取值-1(字符串需要以空字符结尾,否则会出错))

3) 分配足够的内存块,用于存放转换后的Unicode字符串;

该内存块的大小由前面对cchWideChar()函数的返回值来决定;(也可以用别的方法,但该方法更节省内存)

4) 再次调用MultiByteToWideChar()函数,这次将缓存的地址作为lpWideCharStr,参数来传递,并传递第一次调用MultiByteToWideChar()函数返回值作为cchWideChar参数的值;

5) 使用转换后的字符串;

6) 释放接收缓冲区占用的内存块;

示例代码:

  1. void main()  
  2. {  
  3.     char sBuf[25]={0};  
  4.   
  5.     strcpy(sBuf, "我最棒");  
  6.   
  7.     //获取输入缓存大小  
  8.     int sBufSize=strlen(sBuf);  
  9.     //获取输出缓存大小  
  10.     //VC++ 默认使用ANSI,故取第一个参数为CP_ACP  
  11.     DWORD dBufSize=MultiByteToWideChar(CP_ACP, 0, sBuf, sBufSize, NULL, 0);  
  12.     printf("需要wchar_t%u个\n", dBufSize);  
  13.   
  14.     wchar_t * dBuf=new wchar_t[dBufSize];  
  15.     wmemset(dBuf, 0, dBufSize);  
  16.   
  17.     //进行转换  
  18.     int nRet=MultiByteToWideChar(CP_ACP, 0, sBuf, sBufSize, dBuf, dBufSize);  
  19.       
  20.     if(nRet<=0)  
  21.     {  
  22.         cout<<"转换失败"<<endl;  
  23.         DWORD dwErr=GetLastError();  
  24.         switch(dwErr)  
  25.         {  
  26.         case ERROR_INSUFFICIENT_BUFFER:  
  27.             printf("ERROR_INSUFFICIENT_BUFFER\n");  
  28.             break;  
  29.         case ERROR_INVALID_FLAGS:  
  30.             printf("ERROR_INVALID_FLAGS\n");  
  31.             break;  
  32.         case ERROR_INVALID_PARAMETER:  
  33.             printf("ERROR_INVALID_PARAMETER\n");  
  34.             break;  
  35.         case ERROR_NO_UNICODE_TRANSLATION:  
  36.             printf("ERROR_NO_UNICODE_TRANSLATION\n");  
  37.             break;  
  38.         }  
  39.     }  
  40.     else  
  41.     {  
  42.         cout<<"转换成功"<<endl;  
  43.         cout<<dBuf;   
  44.     }  
  45.   
  46.     delete(dBuf);  
  47. }  
注意:两次调用MultiCharToWideChar()时,形参cchMultiByte的取值需要相同,否则可能会出现接收缓存不足之类的错误,从而导致转换失败!

 ( 2 ) 从宽字节转为窄字节字符串

步骤与(1)类似,故不赘述

代码示例如下:

  1. //从宽字符串转换窄字符串  
  2. wchar_t sBuf[25]={0};  
  3. wcscpy(sBuf, L"我最棒");  
  4.   
  5. //获取转换所需的目标缓存大小  
  6. DWORD dBufSize=WideCharToMultiByte(CP_OEMCP, 0, sBuf, -1, NULL,0,NULL, FALSE);  
  7.   
  8. //分配目标缓存  
  9. char *dBuf = new char[dBufSize];  
  10. memset(dBuf, 0, dBufSize);  
  11.   
  12. //转换  
  13. int nRet=WideCharToMultiByte(CP_OEMCP, 0, sBuf, -1, dBuf, dBufSize, NULL, FALSE);  
  14.   
  15. if(nRet<=0)  
  16. {  
  17.     printf("转换失败\n");  
  18. }  
  19. else  
  20. {  
  21.     printf("转换成功\nAfter Convert: %s\n", dBuf);  
  22. }  
  23. delete []dBuf;  

三、MultiByteToWideChar()函数乱码的问题

有的朋友可能已经发现,在标准的WinCE4.2或WinCE5.0 SDK模拟器下,这个函数都无法正常工作,其转换之后的字符全是乱码!

及时更改MultiByteToWideChar()参数也依然如此。不过这个不是代码问题,其结症在于所定制的操作系统.如果我们定制的操作系统默认语言不是中文,也会出现这种情况。

由于标准的SDK默认语言为英文,所以肯定会出现这个问题。而这个问题的解决,不能在简单地更改控制面板的"区域选项"的"默认语言",而是要在系统定制的时候,选择默认语言为"中文"。系统定制时选择默认语言的位置于:   Platform -> Setting... -> locale -> default language ,选择"中文",然后编译即可。

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值