WideCharToMultiByte和MultiByteToWideChar函数的用法 (转)

先看看这篇关于Windows编码的文章:http://blog.csdn.net/shyboy_nwpu/article/details/4431668   

再看看这篇关于两个函数参数和用法的说明:http://www.cnblogs.com/wind-net/archive/2012/10/10/2718340.html   

为了支持Unicode编码,需要多字节与宽字节之间的相互转换。这两个系统函数在使用时需要指定代码页。   

WideCharToMultiByte的代码页用来标记与新转换的字符串相关的代码页。  

MultiByteToWideChar的代码页用来标记与一个多字节字符串相关的代码页。

常用的代码页由CP_ACP和CP_UTF8两个:  

使用CP_ACP代码页就实现了ANSI与Unicode之间的转换。  

使用CP_UTF8代码页就实现了UTF-8与Unicode之间的转换。

wstring ANSIToUnicode( const string& str )
{
	int len = 0;
	len = str.length();
	int unicodeLen = ::MultiByteToWideChar( CP_ACP,
            				0,
            				str.c_str(),
            				-1,
            				NULL,
            				0 ); 
	wchar_t * pUnicode; 
	pUnicode = new wchar_t[unicodeLen+1]; 
	memset(pUnicode,0,(unicodeLen+1)*sizeof(wchar_t)); 
	::MultiByteToWideChar( CP_ACP,
        	 	0,
         		str.c_str(),
        	 	-1,
        	 (LPWSTR)pUnicode,
         	unicodeLen ); 
wstring rt; 
rt = ( wchar_t* )pUnicode;
delete pUnicode; 
return rt; 
}


 

string UnicodeToANSI( const wstring& str )
{
char*     pElementText;
int    iTextLen;
// wide char to multi char
iTextLen = WideCharToMultiByte( CP_ACP,
         0,
         str.c_str(),
         -1,
         NULL,
        0,
         NULL,
         NULL );
pElementText = new char[iTextLen + 1];
memset( ( void* )pElementText, 0, sizeof( char ) * ( iTextLen + 1 ) );
::WideCharToMultiByte( CP_ACP,
         0,
         str.c_str(),
         -1,
         pElementText,
         iTextLen,
         NULL,
         NULL );
string strText;
strText = pElementText;
delete[] pElementText;
return strText;
}

wstring UTF8ToUnicode( const string& str )
{
int len = 0;
len = str.length();
int unicodeLen = ::MultiByteToWideChar( CP_UTF8,
            0,
            str.c_str(),
            -1,
            NULL,
            0 ); 
wchar_t * pUnicode; 
pUnicode = new wchar_t[unicodeLen+1]; 
memset(pUnicode,0,(unicodeLen+1)*sizeof(wchar_t)); 
::MultiByteToWideChar( CP_UTF8,
         0,
         str.c_str(),
        -1,
         (LPWSTR)pUnicode,
         unicodeLen ); 
wstring rt; 
rt = ( wchar_t* )pUnicode;
delete pUnicode; 
return rt; 
}

string UnicodeToUTF8( const wstring& str )
{
char*     pElementText;
int    iTextLen;
// wide char to multi char
iTextLen = WideCharToMultiByte( CP_UTF8,
         0,
         str.c_str(),
         -1,
         NULL,
         0,
         NULL,
         NULL );
pElementText = new char[iTextLen + 1];
memset( ( void* )pElementText, 0, sizeof( char ) * ( iTextLen + 1 ) );
::WideCharToMultiByte( CP_UTF8,
         0,
         str.c_str(),
         -1,
         pElementText,
         iTextLen,
         NULL,
         NULL );
string strText;
strText = pElementText;
delete[] pElementText;
return strText;

}	
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
MultiByteToWideChar和WideCharToMultiByte是Windows API中用于Unicode和ANSI字符串之间的换的函数。下面是它们的使用方法和参数详解: ### MultiByteToWideChar ```c++ int MultiByteToWideChar( UINT CodePage, //换的代码页,如CP_UTF8 DWORD dwFlags, //换标志,如MB_ERR_INVALID_CHARS LPCSTR lpMultiByteStr, //输入的ANSI字符串 int cbMultiByte, //输入的ANSI字符串的字节数 LPWSTR lpWideCharStr, //输出的Unicode字符串 int cchWideChar //输出的Unicode字符串的字符数 ); ``` - CodePage:换的代码页,如CP_UTF8表示UTF-8编码。如果为0,则表示使用当前系统的ANSI代码页。 - dwFlags:换标志,如MB_ERR_INVALID_CHARS表示如果输入的ANSI字符串中包含无法换的字符,则返回一个错误。 - lpMultiByteStr:输入的ANSI字符串。 - cbMultiByte:输入的ANSI字符串的字节数。如果为-1,则表示输入的字符串是以NULL结尾的字符串。 - lpWideCharStr:输出的Unicode字符串。 - cchWideChar:输出的Unicode字符串的字符数。如果为0,则表示函数返回需要的缓冲区大小(以字符为单位)。 ### WideCharToMultiByte ```c++ int WideCharToMultiByte( UINT CodePage, //换的代码页,如CP_UTF8 DWORD dwFlags, //换标志,如WC_ERR_INVALID_CHARS LPCWSTR lpWideCharStr, //输入的Unicode字符串 int cchWideChar, //输入的Unicode字符串的字符数 LPSTR lpMultiByteStr, //输出的ANSI字符串 int cbMultiByte, //输出的ANSI字符串的字节数 LPCSTR lpDefaultChar, //无法换的Unicode字符的默认ANSI字符 LPBOOL lpUsedDefaultChar //是否使用了默认字符 ); ``` - CodePage:换的代码页,如CP_UTF8表示UTF-8编码。如果为0,则表示使用当前系统的ANSI代码页。 - dwFlags:换标志,如WC_ERR_INVALID_CHARS表示如果输入的Unicode字符串中包含无法换的字符,则返回一个错误。 - lpWideCharStr:输入的Unicode字符串。 - cchWideChar:输入的Unicode字符串的字符数。如果为-1,则表示输入的字符串是以NULL结尾的字符串。 - lpMultiByteStr:输出的ANSI字符串。 - cbMultiByte:输出的ANSI字符串的字节数。如果为0,则表示函数返回需要的缓冲区大小(以字节为单位)。 - lpDefaultChar:无法换的Unicode字符的默认ANSI字符。 - lpUsedDefaultChar:输出参数,指示是否使用了默认字符。 注意事项: - 如果输入的ANSI字符串中包含无法换的字符,则需要设置dwFlags为MB_ERR_INVALID_CHARS,否则函数会返回一个错误。 - 如果输入的Unicode字符串中包含无法换的字符,则需要设置dwFlags为WC_ERR_INVALID_CHARS,否则函数会返回一个错误。 - 在使用WideCharToMultiByte函数时,如果输出的ANSI字符串中包含多字节字符,则需要使用一个足够大的缓冲区,否则函数会返回一个错误。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值