WideCharToMultiByte和MultiByteToWideChar函数的用法

WideCharToMultiByte和MultiByteToWideChar函数的用法

为了支持Unicode编码,需要多字节与宽字节之间的相互转换。这两个系统函数在使用时需要指定代码页,在实际应用过程中遇到乱码问题,然后重新阅读《Windows核心编程》,总结出正确的用法。
WideCharToMultiByte的代码页用来标记与新转换的字符串相关的代码页。
MultiByteToWideChar的代码页用来标记与一个多字节字符串相关的代码页。
常用的代码页由CP_ACP和CP_UTF8两个。
使用CP_ACP代码页就实现了ANSI与Unicode之间的转换。
使用CP_UTF8代码页就实现了UTF-8与Unicode之间的转换。
下面是代码实现:
1.  ANSI to Unicode
wstring ANSIToUnicode( const string& str )
{
 int  len = 0;
 len = str.length();
 int  unicodeLen = ::MultiByteToWideChar( CP_ACP,
            0,
            str.c_str(),
            -1,
            NULL,
            0 );  
 wchar_t *  pUnicode;  
 pUnicode = new  wchar_t[unicodeLen+1];  
 memset(pUnicode,0,(unicodeLen+1)*sizeof(wchar_t));  
 ::MultiByteToWideChar( CP_ACP,
         0,
         str.c_str(),
         -1,
         (LPWSTR)pUnicode,
         unicodeLen );  
 wstring  rt;  
 rt = ( wchar_t* )pUnicode;
 delete  pUnicode; 
 
 return  rt;  
}
2.  Unicode to ANSI
string UnicodeToANSI( const wstring& str )
{
 char*     pElementText;
 int    iTextLen;
 // wide char to multi char
 iTextLen = WideCharToMultiByte( CP_ACP,
         0,
         str.c_str(),
         -1,
         NULL,
         0,
NULL,
         NULL );
 pElementText = new char[iTextLen + 1];
 memset( ( void* )pElementText, 0, sizeof( char ) * ( iTextLen + 1 ) );
 ::WideCharToMultiByte( CP_ACP,
         0,
         str.c_str(),
         -1,
         pElementText,
         iTextLen,
         NULL,
         NULL );
 string strText;
 strText = pElementText;
 delete[] pElementText;
 return strText;
}
3.  UTF-8 to Unicode
wstring UTF8ToUnicode( const string& str )
{
 int  len = 0;
 len = str.length();
 int  unicodeLen = ::MultiByteToWideChar( CP_UTF8,
            0,
            str.c_str(),
            -1,
            NULL,
            0 );  
 wchar_t *  pUnicode;  
 pUnicode = new  wchar_t[unicodeLen+1];  
 memset(pUnicode,0,(unicodeLen+1)*sizeof(wchar_t));  
 ::MultiByteToWideChar( CP_UTF8,
         0,
         str.c_str(),
         -1,
         (LPWSTR)pUnicode,
         unicodeLen );  
 wstring  rt;  
 rt = ( wchar_t* )pUnicode;
 delete  pUnicode; 
 
 return  rt;  
}
4.  Unicode to UTF-8    
string UnicodeToUTF8( const wstring& str )
{
 char*     pElementText;
 int    iTextLen;
 // wide char to multi char
 iTextLen = WideCharToMultiByte( CP_UTF8,
         0,
         str.c_str(),
         -1,
         NULL,
         0,
         NULL,
         NULL );
 pElementText = new char[iTextLen + 1];
 memset( ( void* )pElementText, 0, sizeof( char ) * ( iTextLen + 1 ) );
 ::WideCharToMultiByte( CP_UTF8,
         0,
         str.c_str(),
         -1,
         pElementText,
         iTextLen,
         NULL,
         NULL );
 string strText;
 strText = pElementText;
 delete[] pElementText;
 return strText;
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
MultiByteToWideChar和WideCharToMultiByte是Windows API中用于Unicode和ANSI字符串之间的转换的函数。下面是它们的使用方法和参数详解: ### MultiByteToWideChar ```c++ int MultiByteToWideChar( UINT CodePage, //转换的代码页,如CP_UTF8 DWORD dwFlags, //转换标志,如MB_ERR_INVALID_CHARS LPCSTR lpMultiByteStr, //输入的ANSI字符串 int cbMultiByte, //输入的ANSI字符串的字节数 LPWSTR lpWideCharStr, //输出的Unicode字符串 int cchWideChar //输出的Unicode字符串的字符数 ); ``` - CodePage:转换的代码页,如CP_UTF8表示UTF-8编码。如果为0,则表示使用当前系统的ANSI代码页。 - dwFlags:转换标志,如MB_ERR_INVALID_CHARS表示如果输入的ANSI字符串中包含无法转换的字符,则返回一个错误。 - lpMultiByteStr:输入的ANSI字符串。 - cbMultiByte:输入的ANSI字符串的字节数。如果为-1,则表示输入的字符串是以NULL结尾的字符串。 - lpWideCharStr:输出的Unicode字符串。 - cchWideChar:输出的Unicode字符串的字符数。如果为0,则表示函数返回需要的缓冲区大小(以字符为单位)。 ### WideCharToMultiByte ```c++ int WideCharToMultiByte( UINT CodePage, //转换的代码页,如CP_UTF8 DWORD dwFlags, //转换标志,如WC_ERR_INVALID_CHARS LPCWSTR lpWideCharStr, //输入的Unicode字符串 int cchWideChar, //输入的Unicode字符串的字符数 LPSTR lpMultiByteStr, //输出的ANSI字符串 int cbMultiByte, //输出的ANSI字符串的字节数 LPCSTR lpDefaultChar, //无法转换的Unicode字符的默认ANSI字符 LPBOOL lpUsedDefaultChar //是否使用了默认字符 ); ``` - CodePage:转换的代码页,如CP_UTF8表示UTF-8编码。如果为0,则表示使用当前系统的ANSI代码页。 - dwFlags:转换标志,如WC_ERR_INVALID_CHARS表示如果输入的Unicode字符串中包含无法转换的字符,则返回一个错误。 - lpWideCharStr:输入的Unicode字符串。 - cchWideChar:输入的Unicode字符串的字符数。如果为-1,则表示输入的字符串是以NULL结尾的字符串。 - lpMultiByteStr:输出的ANSI字符串。 - cbMultiByte:输出的ANSI字符串的字节数。如果为0,则表示函数返回需要的缓冲区大小(以字节为单位)。 - lpDefaultChar:无法转换的Unicode字符的默认ANSI字符。 - lpUsedDefaultChar:输出参数,指示是否使用了默认字符。 注意事项: - 如果输入的ANSI字符串中包含无法转换的字符,则需要设置dwFlags为MB_ERR_INVALID_CHARS,否则函数会返回一个错误。 - 如果输入的Unicode字符串中包含无法转换的字符,则需要设置dwFlags为WC_ERR_INVALID_CHARS,否则函数会返回一个错误。 - 在使用WideCharToMultiByte函数时,如果输出的ANSI字符串中包含多字节字符,则需要使用一个足够大的缓冲区,否则函数会返回一个错误。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值