MultiByteToWideChar和WideCharToMultiByte用法详解

   MultiByteToWideChar:

        函数功能:该函数映射一个字符串到一个宽字符(unicode)的字符串。由该函数映射的字符串没必要是多字节字符组。

  函数原型:int MultiByteToWideChar(UINT CodePage, DWORD dwFlags,LPCSTR lpMultiByteStr, int cchMultiByte, LPWSTR lpWideCharStr, intcchWideChar);

  参数:

  CodePage:指定执行转换的代码页,这个参数可以为系统已安装或有效的任何代码页所给定的值。你也可以指定其为下面的任意一值:

  CP_ACP:ANSI代码页;CP_MACCP:Macintosh代码页;CP_OEMCP:OEM代码页;

  CP_SYMBOL:符号代码页(42);CP_THREAD_ACP:当前线索ANSI代码页;

  CP_UTF7:使用UTF-7转换;CP_UTF8:使用UTF-8转换。

  dwFlags:一组位标记用以指出是否未转换成预作或宽字符(若组合形式存在),是否使用象形文字替代控制字符,以及如何处理无效字符。你可以指定下面是标记常量的组合,含义如下:

  MB_PRECOMPOSED:通常使用预作字符——就是说,由一个基本字符和一个非空字符组成的字符只有一个单一的字符值。这是缺省的转换选择。不能与

  MB_COMPOSITE值一起使用。

  MB_COMPOSITE:通常使用组合字符——就是说,由一个基本字符和一个非空字符组成的字符分别有不同的字符值。这是缺省的转换选择。不能与MB_PRECOMPOSED值一起使用。

  MB_ERR_INVALID_CHARS:如果函数遇到无效的输入字符,它将运行失败,且GetLastErro返回ERROR_NO_UNICODE_TRANSLATION值。

  MB_USEGLYPHCHARS:使用象形文字替代控制字符。

  组合字符由一个基础字符和一个非空字符构成,每一个都有不同的字符值。每个预作字符都有单一的字符值给基础/非空字符的组成。在字符è中,e就是基础字符,而重音符标记就是非空字符。

  函数的缺省动作是转换成预作的形式。如果预作的形式不存在,函数将尝试转换成组合形式。

  标记MB_PRECOMPOSED和MB_COMPOSITE是互斥的,而标记MB_USEGLYPHCHARS和MB_ERR_INVALID_CHARS则不管其它标记如何都可以设置。

  lpMultiByteStr:指向将被转换字符串的字符。
     cchMultiByte:指定由参数lpMultiByteStr指向的字符串中字节的个数。如果这个值为C1,字符串将被设定为以NULL为结束符的字符串,并且自动计算长度。
     lpWideCharStr:指向接收被转换字符串的缓冲区。

  cchWideChar:指定由参数lpWideCharStr指向的缓冲区的字节个数。若此值为零,函数返回缓冲区所必需的宽字符数,在这种情况下,lpWideCharStr中的缓冲区不被使用。

  返回值:如果函数运行成功,并且cchWideChar不为零,返回值是由lpWideCharStr指向的缓冲区中写入的宽字符数;如果函数运行成功,并且cchMultiByte为零,返回值是接收到待转换字符串的缓冲区所需求的宽字符数大小。如果函数运行失败,返回值为零。若想获得更多错误信息,请调用GetLastError函数。它可以返回下面所列错误代码:

  ERROR_INSUFFICIENT_BJFFER;ERROR_INVALID_FLAGS;

  ERROR_INVALID_PARAMETER;ERROR_NO_UNICODE_TRANSLATION。

  注意:指针lpMultiByteStr和lpWideCharStr必须不一样。如果一样,函数将失败,GetLastError将返回ERROR_INVALID_PARAMETER的值。

  如果MB_ERR_INVALID_CHARS被设置并且在资源字符串中遇到无效的字符时,函数将失败。如果MB_ERR_INVALID_CHARS不被设置,或是DBCS串中发现了头字节而没有有效的尾字节,无效字符将转换为缺省字符,但不是资源字符串中的缺省字符。当无效字符被发现,且MB_ERR_INVALID_CHARS值被设置,函数返回零,GetLastErro显示ERROR_NO_UNICODE_TRANSLATION的出错信息。

  WindowsCE:不支持参数CodePage中的CP_UTF7和CP_UTF8的值,以及参数dwFlags中的WC_NO_BEST_FIT_CHARS值。

下面是各种编码转换的例子

  1. // 多字节编码转为UTF8编码  
  2. bool MBToUTF8(vector<char>& pu8, const char* pmb, int32 mLen)  
  3. {  
  4.  // convert an MBCS string to widechar   
  5.  int32 nLen = MultiByteToWideChar(CP_ACP, 0, pmb, mLen, NULL, 0);  
  6.    
  7.  WCHAR* lpszW = NULL;  
  8.  try  
  9.  {  
  10.     lpszW = new WCHAR[nLen];  
  11.  }  
  12.  catch(bad_alloc &memExp)  
  13.  {  
  14.     return false;  
  15.  }  
  16.   
  17.  int32 nRtn = MultiByteToWideChar(CP_ACP, 0, pmb, mLen, lpszW, nLen);  
  18.    
  19.  if(nRtn != nLen)  
  20.  {  
  21.     delete[] lpszW;  
  22.     return false;  
  23.  }  
  24.  // convert an widechar string to utf8  
  25.  int32 utf8Len = WideCharToMultiByte(CP_UTF8, 0, lpszW, nLen, NULL, 0, NULL, NULL);  
  26.  if (utf8Len <= 0)  
  27.  {  
  28.      return false;  
  29.  }  
  30.  pu8.resize(utf8Len);  
  31.  nRtn = WideCharToMultiByte(CP_UTF8, 0, lpszW, nLen, &*pu8.begin(), utf8Len, NULL, NULL);  
  32.  delete[] lpszW;  
  33.   
  34.  if (nRtn != utf8Len)  
  35.  {  
  36.      pu8.clear();  
  37.      return false;  
  38.  }  
  39.  return true;  
  40. }  
  41.   
  42. // UTF8编码转为多字节编码  
  43. bool UTF8ToMB(vector<char>& pmb, const char* pu8, int32 utf8Len)  
  44. {  
  45.     // convert an UTF8 string to widechar   
  46.     int32 nLen = MultiByteToWideChar(CP_UTF8, 0, pu8, utf8Len, NULL, 0);  
  47.   
  48.     WCHAR* lpszW = NULL;  
  49.     try  
  50.     {  
  51.         lpszW = new WCHAR[nLen];  
  52.     }  
  53.     catch(bad_alloc &memExp)  
  54.     {  
  55.         return false;  
  56.     }  
  57.   
  58.     int32 nRtn = MultiByteToWideChar(CP_UTF8, 0, pu8, utf8Len, lpszW, nLen);  
  59.   
  60.     if(nRtn != nLen)  
  61.     {  
  62.         delete[] lpszW;  
  63.         return false;  
  64.     }  
  65.   
  66.     // convert an widechar string to Multibyte   
  67.     int32 MBLen = WideCharToMultiByte(CP_ACP, 0, lpszW, nLen, NULL, 0, NULL, NULL);  
  68.     if (MBLen <=0)  
  69.     {  
  70.         return false;  
  71.     }  
  72.     pmb.resize(MBLen);  
  73.     nRtn = WideCharToMultiByte(CP_ACP, 0, lpszW, nLen, &*pmb.begin(), MBLen, NULL, NULL);  
  74.     delete[] lpszW;  
  75.   
  76.     if(nRtn != MBLen)  
  77.     {  
  78.         pmb.clear();  
  79.         return false;  
  80.     }  
  81.     return true;  
  82. }  
  83.   
  84. // 多字节编码转为Unicode编码  
  85. bool MBToUnicode(vector<wchar_t>& pun, const char* pmb, int32 mLen)  
  86. {  
  87.     // convert an MBCS string to widechar   
  88.     int32 uLen = MultiByteToWideChar(CP_ACP, 0, pmb, mLen, NULL, 0);  
  89.   
  90.     if (uLen<=0)  
  91.     {  
  92.         return false;  
  93.     }  
  94.     pun.resize(uLen);  
  95.   
  96.     int32 nRtn = MultiByteToWideChar(CP_ACP, 0, pmb, mLen, &*pun.begin(), uLen);  
  97.   
  98.     if (nRtn != uLen)  
  99.     {  
  100.         pun.clear();  
  101.         return false;  
  102.     }  
  103.     return true;  
  104. }  
  105.   
  106. //Unicode编码转为多字节编码  
  107. bool UnicodeToMB(vector<char>& pmb, const wchar_t* pun, int32 uLen)  
  108. {  
  109.     // convert an widechar string to Multibyte   
  110.     int32 MBLen = WideCharToMultiByte(CP_ACP, 0, pun, uLen, NULL, 0, NULL, NULL);  
  111.     if (MBLen <=0)  
  112.     {  
  113.         return false;  
  114.     }  
  115.     pmb.resize(MBLen);  
  116.     int nRtn = WideCharToMultiByte(CP_ACP, 0, pun, uLen, &*pmb.begin(), MBLen, NULL, NULL);  
  117.   
  118.     if(nRtn != MBLen)  
  119.     {  
  120.         pmb.clear();  
  121.         return false;  
  122.     }  
  123.     return true;  
  124. }  
  125.   
  126. // UTF8编码转为Unicode  
  127. bool UTF8ToUnicode(vector<wchar_t>& pun, const char* pu8, int32 utf8Len)  
  128. {  
  129.     // convert an UTF8 string to widechar   
  130.     int32 nLen = MultiByteToWideChar(CP_UTF8, 0, pu8, utf8Len, NULL, 0);  
  131.     if (nLen <=0)  
  132.     {  
  133.         return false;  
  134.     }  
  135.     pun.resize(nLen);  
  136.     int32 nRtn = MultiByteToWideChar(CP_UTF8, 0, pu8, utf8Len, &*pun.begin(), nLen);  
  137.   
  138.     if(nRtn != nLen)  
  139.     {  
  140.         pun.clear();  
  141.         return false;  
  142.     }  
  143.   
  144.     return true;  
  145. }  
  146.   
  147. // Unicode编码转为UTF8  
  148. bool UnicodeToUTF8(vector<char>& pu8, const wchar_t* pun, int32 uLen)  
  149. {  
  150.     // convert an widechar string to utf8  
  151.     int32 utf8Len = WideCharToMultiByte(CP_UTF8, 0, pun, uLen, NULL, 0, NULL, NULL);  
  152.     if (utf8Len<=0)  
  153.     {  
  154.         return false;  
  155.     }  
  156.     pu8.resize(utf8Len);  
  157.     int32 nRtn = WideCharToMultiByte(CP_UTF8, 0, pun, uLen, &*pu8.begin(), utf8Len, NULL, NULL);  
  158.   
  159.     if (nRtn != utf8Len)  
  160.     {  
  161.         pu8.clear();  
  162.         return false;  
  163.     }  
  164.     return true;  


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值