MultiByteToWideChar,
WideCharToMultiByte
Windows提供了两种API函数:MultiByteToWideChar()和WideCharToMultiByte()
用于字符串和宽字符串的互相转换。
int MultiByteToWideChar(
UINT CodePage,
DWORD dwFlags,
LPCSTR lpMultiByteStr,
int cchMultiByte,
LPWSTR lpWideCharStr,
int cchWideChar
);
1> CodePage:指定执行转换的多字节字符所使用的字符集
这个参数可以为系统已安装或有效的任何字符集所给定的值。你也可以指定其为下面的任意一值:
Value Description
CP_ACP ANSI code page
CP_MACCP Not supported
CP_OEMCP OEM code page
CP_SYMBOL Not supported
CP_THREAD_ACP Not supported
CP_UTF7 UTF-7 code page
CP_UTF8 UTF-8 code page
2> dwFlags:一组位标记,用以指出是否未转换成预作或宽字符(若组合形式存在),是否使用象形文字替代控制字符,以及如何处理无效字符。你可以指定下面是标记常量的组合,含义如下:
3> lpMultiByteStr:指向待转换的字符串的缓冲区。
4> cchMultiByte:指定由参数lpMultiByteStr指向的字符串中字节的个数。可以设置为-1,会自动判断lpMultiByteStr指定的字符串的长度
(如果字符串不是以空字符中止,设置为-1可能失败,可能成功),此参数设置为0函数将失败。
5> lpWideCharStr:指向接收被转换字符串的缓冲区。
6> cchWideChar:指定由参数lpWideCharStr指向的缓冲区的宽字节数。若此值为0,函数不会执行转换,而是返回目标缓存lpWideChatStr所需的宽字符数。
返回值:
如果函数运行成功,并且cchWideChar不为0,返回值是由lpWideCharStr指向的缓冲区中写入的宽字符数;
如果函数运行成功,并且cchMultiByte为0,返回值是待转换字符串的缓冲区所需求的宽字符数大小。(此种情况用来获取转换所需的wchar_t的个数)
如果函数运行失败,返回值为零。
( 2 ) WideCharToMultiByte()
int WideCharToMultiByte(
UINT CodePage,
DWORD dwFlags,
LPCWSTR lpWideCharStr,
int cchWideChar,
LPSTR lpMultiByteStr,
int cchMultiByte,
LPCSTR lpDefaultChar,
LPBOOL pfUsedDefaultChar
);
头文件:windows.h
这两个函数是由Windows API函数,不具有通用性。
mbstowcs_s,wcstombs_s
C++中的标准库函数提供了两种函数mbstowcs_s()和wcstombs_s()
用于字符串和宽字符串的互相转换。
头文件:stdlib.h
这两个函数是C语言标准库函数,具有通用性。
linux下::
#include <stdlib.h>
mbstowcs() 函数
功能:把多字节字符转换成宽字节
原型:
size_t mbstowcs(
wchar_t *wcstr,
const char *mbstr,
size_t count
);
参数说明:
wcstr 目标缓存,用来存放转换之后的宽字节字符;当取值为NULL时,返回值为目标缓存所需wchar_t类型的个数
mbstr 用来存放待转换的多字节字符串
count 用来指定最多转换多少Byte。当wcst取值为NULL时,该值无用
返回值:
转换成功,且wcstr == NULL时,返回目标缓存所需的大小(wchar_t 类型的个数,但不含终结符);
转换成功,且wcstd != NULL时,返回转换的字节数;
转换不成功,返回(size_t)(-1);
使用步骤:
调用mbstowcs()函数,设置参数 wcstr 为NULL(用以获取转换所需的接收缓冲区大小);
给目标缓存区分配足够的内存块,用于存放转换后的wchar_t字符串;
注意:该内存块的大小由首次调用mbstowcs()函数的返回值来决定(该返回值不包含终止符的空间)
再次调用mbstowcs()函数,这次将目标缓存的地址作为 wcstr 参数来传递;
strcpy(sBuf, "我最棒");
size_t sSize=strlen(sBuf);
wchar_t * dBuf=NULL;
//注意:需要多分配一个空间,以存放终止符
int dSize=mbstowcs(dBuf, sBuf, 0)+1;
dBuf=new wchar_t[dSize];
wmemset(dBuf, 0, dSize);
int nRet=mbstowcs(dBuf, sBuf, sSize);
if(nRet<=0)
{
printf("转换失败\n");
}
else
{
printf("转换成功%d字符\n", nRet);
wprintf(L"%ls\n", dBuf);
}
wcstombs()
wcstombs() 函数
功能:把宽字节转换成多字节字符串
原型:
size_t wcstombs(
char *mbstr,
const wchar_t *wcstr,
size_t count
);
参数说明:
mbstr 用来存放待转换的宽字符;当取值为NULL时,返回值为目标缓存所需wchar_t类型的个数;
wcstr 目标缓存,用来存放转换之后的多字节字符;
count 用来指定接收缓存里能够存储的最大的字节数;
返回值:
转换成功,且mbstr == NULL时,返回目标缓存所需的大小(char 类型个数,但不含终结符);
转换成功,且mbstr != NULL时,返回转换的字节数;
转换不成功,返回(size_t)(-1);
使用方法:
与mbstowcs()方法类似
wchar_t sBuf[20]={0};
wcscpy(sBuf, L"Hello");
size_t sSize=wcslen(sBuf);
char * dBuf=NULL;
int dSize=wcstombs(dBuf, sBuf, 0)+1;
printf("需要%d Char\n", dSize);
dBuf=new char[dSize];
memset(dBuf, 0, dSize);
int nRet=wcstombs(dBuf, sBuf, dSize);
if(nRet<=0)
{
printf("转换失败\n");
}
else
{
printf("转换成功%d字符\n", nRet);
printf("%s\n", dBuf);
}
mbstowcs,wcstombs
size_t ret;
char *MB = (char *)malloc( BUFFER_SIZE );
wchar_t *WC = L"http://www.w3cschool.cc";
char *ML ="http://www.w3cschool.cc";
ret =wcstombs(nullptr,WC,0);
printf("====%u\n",ret);
/* 转换宽字符字符串 */
ret = wcstombs(MB, WC, BUFFER_SIZE);
printf("要转换的字符数 = %u\n", ret);
printf("多字节字符 = %s\n", MB);
ret=0;
ret=mbstowcs(nullptr,MB,0);
printf("====%u\n",ret);
wchar_t *wstr = new wchar_t[BUFFER_SIZE];
memset(wstr, 0, ret * sizeof(wchar_t));
ret =mbstowcs(wstr,MB,BUFFER_SIZE);
printf("====%u\n",ret);
cout<<"宽字符字符串 =";
wcout<<wstr<<endl;
返回