函数原型:int MultiByteToWideChar(UINT CodePage, DWORD dwFlags,LPCSTR lpMultiByteStr, int cchMultiByte, LPWSTR lpWideCharStr, intcchWideChar);
参数:
CodePage:指定执行转换的代码页,这个参数可以为系统已安装或有效的任何代码页所给定的值。你也可以指定其为下面的任意一值:
CP_ACP:ANSI代码页;CP_MACCP:Macintosh代码页;CP_OEMCP:OEM代码页;
CP_SYMBOL:符号代码页(42);CP_THREAD_ACP:当前线索ANSI代码页;
CP_UTF7:使用UTF-7转换;CP_UTF8:使用UTF-8转换。
dwFlags:一组位标记用以指出是否未转换成预作或宽字符(若组合形式存在),是否使用象形文字替代控制字符,以及如何处理无效字符。你可以指定下面是标记常量的组合,含义如下:
MB_PRECOMPOSED:通常使用预作字符——就是说,由一个基本字符和一个非空字符组成的字符只有一个单一的字符值。这是缺省的转换选择。不能与
MB_COMPOSITE值一起使用。
MB_COMPOSITE:通常使用组合字符——就是说,由一个基本字符和一个非空字符组成的字符分别有不同的字符值。这是缺省的转换选择。不能与MB_PRECOMPOSED值一起使用。
MB_ERR_INVALID_CHARS:如果函数遇到无效的输入字符,它将运行失败,且GetLastErro返回ERROR_NO_UNICODE_TRANSLATION值。
MB_USEGLYPHCHARS:使用象形文字替代控制字符。
组合字符由一个基础字符和一个非空字符构成,每一个都有不同的字符值。每个预作字符都有单一的字符值给基础/非空字符的组成。在字符è中,e就是基础字符,而重音符标记就是非空字符。
函数的缺省动作是转换成预作的形式。如果预作的形式不存在,函数将尝试转换成组合形式。
标记MB_PRECOMPOSED和MB_COMPOSITE是互斥的,而标记MB_USEGLYPHCHARS和MB_ERR_INVALID_CHARS则不管其它标记如何都可以设置。
lpMultiByteStr:指向将被转换字符串的字符。
cchWideChar:指定由参数lpWideCharStr指向的缓冲区的字节个数。若此值为零,函数返回缓冲区所必需的宽字符数,在这种情况下,lpWideCharStr中的缓冲区不被使用。
返回值:如果函数运行成功,并且cchWideChar不为零,返回值是由lpWideCharStr指向的缓冲区中写入的宽字符数;如果函数运行成功,并且cchMultiByte为零,返回值是接收到待转换字符串的缓冲区所需求的宽字符数大小。如果函数运行失败,返回值为零。若想获得更多错误信息,请调用GetLastError函数。它可以返回下面所列错误代码:
ERROR_INSUFFICIENT_BJFFER;ERROR_INVALID_FLAGS;
ERROR_INVALID_PARAMETER;ERROR_NO_UNICODE_TRANSLATION。
注意:指针lpMultiByteStr和lpWideCharStr必须不一样。如果一样,函数将失败,GetLastError将返回ERROR_INVALID_PARAMETER的值。
如果MB_ERR_INVALID_CHARS被设置并且在资源字符串中遇到无效的字符时,函数将失败。如果MB_ERR_INVALID_CHARS不被设置,或是DBCS串中发现了头字节而没有有效的尾字节,无效字符将转换为缺省字符,但不是资源字符串中的缺省字符。当无效字符被发现,且MB_ERR_INVALID_CHARS值被设置,函数返回零,GetLastErro显示ERROR_NO_UNICODE_TRANSLATION的出错信息。
WindowsCE:不支持参数CodePage中的CP_UTF7和CP_UTF8的值,以及参数dwFlags中的WC_NO_BEST_FIT_CHARS值。
下面是各种编码转换的例子
- // 多字节编码转为UTF8编码
- bool MBToUTF8(vector<char>& pu8, const char* pmb, int32 mLen)
- {
- // convert an MBCS string to widechar
- int32 nLen = MultiByteToWideChar(CP_ACP, 0, pmb, mLen, NULL, 0);
- WCHAR* lpszW = NULL;
- try
- {
- lpszW = new WCHAR[nLen];
- }
- catch(bad_alloc &memExp)
- {
- return false;
- }
- int32 nRtn = MultiByteToWideChar(CP_ACP, 0, pmb, mLen, lpszW, nLen);
- if(nRtn != nLen)
- {
- delete[] lpszW;
- return false;
- }
- // convert an widechar string to utf8
- int32 utf8Len = WideCharToMultiByte(CP_UTF8, 0, lpszW, nLen, NULL, 0, NULL, NULL);
- if (utf8Len <= 0)
- {
- return false;
- }
- pu8.resize(utf8Len);
- nRtn = WideCharToMultiByte(CP_UTF8, 0, lpszW, nLen, &*pu8.begin(), utf8Len, NULL, NULL);
- delete[] lpszW;
- if (nRtn != utf8Len)
- {
- pu8.clear();
- return false;
- }
- return true;
- }
- // UTF8编码转为多字节编码
- bool UTF8ToMB(vector<char>& pmb, const char* pu8, int32 utf8Len)
- {
- // convert an UTF8 string to widechar
- int32 nLen = MultiByteToWideChar(CP_UTF8, 0, pu8, utf8Len, NULL, 0);
- WCHAR* lpszW = NULL;
- try
- {
- lpszW = new WCHAR[nLen];
- }
- catch(bad_alloc &memExp)
- {
- return false;
- }
- int32 nRtn = MultiByteToWideChar(CP_UTF8, 0, pu8, utf8Len, lpszW, nLen);
- if(nRtn != nLen)
- {
- delete[] lpszW;
- return false;
- }
- // convert an widechar string to Multibyte
- int32 MBLen = WideCharToMultiByte(CP_ACP, 0, lpszW, nLen, NULL, 0, NULL, NULL);
- if (MBLen <=0)
- {
- return false;
- }
- pmb.resize(MBLen);
- nRtn = WideCharToMultiByte(CP_ACP, 0, lpszW, nLen, &*pmb.begin(), MBLen, NULL, NULL);
- delete[] lpszW;
- if(nRtn != MBLen)
- {
- pmb.clear();
- return false;
- }
- return true;
- }
- // 多字节编码转为Unicode编码
- bool MBToUnicode(vector<wchar_t>& pun, const char* pmb, int32 mLen)
- {
- // convert an MBCS string to widechar
- int32 uLen = MultiByteToWideChar(CP_ACP, 0, pmb, mLen, NULL, 0);
- if (uLen<=0)
- {
- return false;
- }
- pun.resize(uLen);
- int32 nRtn = MultiByteToWideChar(CP_ACP, 0, pmb, mLen, &*pun.begin(), uLen);
- if (nRtn != uLen)
- {
- pun.clear();
- return false;
- }
- return true;
- }
- //Unicode编码转为多字节编码
- bool UnicodeToMB(vector<char>& pmb, const wchar_t* pun, int32 uLen)
- {
- // convert an widechar string to Multibyte
- int32 MBLen = WideCharToMultiByte(CP_ACP, 0, pun, uLen, NULL, 0, NULL, NULL);
- if (MBLen <=0)
- {
- return false;
- }
- pmb.resize(MBLen);
- int nRtn = WideCharToMultiByte(CP_ACP, 0, pun, uLen, &*pmb.begin(), MBLen, NULL, NULL);
- if(nRtn != MBLen)
- {
- pmb.clear();
- return false;
- }
- return true;
- }
- // UTF8编码转为Unicode
- bool UTF8ToUnicode(vector<wchar_t>& pun, const char* pu8, int32 utf8Len)
- {
- // convert an UTF8 string to widechar
- int32 nLen = MultiByteToWideChar(CP_UTF8, 0, pu8, utf8Len, NULL, 0);
- if (nLen <=0)
- {
- return false;
- }
- pun.resize(nLen);
- int32 nRtn = MultiByteToWideChar(CP_UTF8, 0, pu8, utf8Len, &*pun.begin(), nLen);
- if(nRtn != nLen)
- {
- pun.clear();
- return false;
- }
- return true;
- }
- // Unicode编码转为UTF8
- bool UnicodeToUTF8(vector<char>& pu8, const wchar_t* pun, int32 uLen)
- {
- // convert an widechar string to utf8
- int32 utf8Len = WideCharToMultiByte(CP_UTF8, 0, pun, uLen, NULL, 0, NULL, NULL);
- if (utf8Len<=0)
- {
- return false;
- }
- pu8.resize(utf8Len);
- int32 nRtn = WideCharToMultiByte(CP_UTF8, 0, pun, uLen, &*pu8.begin(), utf8Len, NULL, NULL);
- if (nRtn != utf8Len)
- {
- pu8.clear();
- return false;
- }
- return true;
- }