多字节字符串与UNICODE字符串的互相转换

最新推荐文章于 2022-12-09 11:24:03 发布

把大学没学完的学完

最新推荐文章于 2022-12-09 11:24:03 发布

阅读量2k

点赞数 1

分类专栏： windows SDK基础

本文链接：https://blog.csdn.net/u014053368/article/details/23169215

版权

windows SDK基础专栏收录该内容

8 篇文章 0 订阅

订阅专栏

1.用于多字节字符串转换成UNICODE字符串

int
WINAPI
MultiByteToWideChar(
    __in UINT     CodePage,
    __in DWORD    dwFlags,
    __in_bcount(cbMultiByte) LPCSTR   lpMultiByteStr,
    __in int      cbMultiByte,
    __out_ecount_opt(cchWideChar) __transfer(lpMultiByteStr) LPWSTR lpWideCharStr,
    __in int      cchWideChar);

函数功能：将一个多字节的字符串转换成UNICODE字符串

参数说明：

CodePage：指定执行转换的字符集，这个参数可以为系统已安装或有效的任何字符集所给定的值。你也可以指定其为下面的任意一值：

CP_ACP：ANSI字符集；CP_MACCP：Macintosh代码页；CP_OEMCP：OEM代码页；

CP_SYMBOL：符号字符集（42）；CP_THREAD_ACP：当前线程ANSI代码页；

CP_UTF7：使用UTF-7转换；CP_UTF8：使用UTF-8转换。

dwFlags：一组未标记用以指出是否未转换成预作或宽字符（若组合形式存在），是否使用象形文字替代控制字符，以及如何处理无效字符。你可以指定下面是标记常量的组合，含义如下：

MB_PRECOMPOSED：通常使用预作字符——就是说，由一个基本字符和一个非空字符组成的字符只有一个单一的字符值。这是缺省的转换选择。不能与

MB_COMPOSITE值一起使用。

MB_COMPOSITE：通常使用组合字符——就是说，由一个基本字符和一个非空字符组成的字符分别有不同的字符值。不能与MB_PRECOMPOSED值一起使用。

MB_ERR_INVALID_CHARS：如果函数遇到无效的输入字符，它将运行失败，且GetLastErro返回ERROR_NO_UNICODE_TRANSLATION值。

MB_USEGLYPHCHARS：使用象形文字替代控制字符。

组合字符由一个基础字符和一个非空字符构成，每一个都有不同的字符值。每个预作字符都有单一的字符值给基础/非空字符的组成。在字符è中，e就是基础字符，而重音符标记就是非空字符。

函数的缺省动作是转换成预作的形式。如果预作的形式不存在，函数将尝试转换成组合形式。

标记MB_PRECOMPOSED和MB_COMPOSITE是互斥的，而标记MB_USEGLYPHCHARS和MB_ERR_INVALID_CHARS则不管其它标记如何都可以设置。

lpMultiByteStr：指向将被转换字符串的字符。

cchMultiByte：指定由参数lpMultiByteStr指向的字符串中字节的个数。如果lpMultiByteStr指定的字符串以空字符终止，可以设置为-1（如果字符串不是以空字符中止，设置为-1可能失败，可能成功），此参数设置为0函数将失败。

lpWideCharStr：指向接收被转换字符串的缓冲区。

cchWideChar：指定由参数lpWideCharStr指向的缓冲区的宽字符个数。若此值为零，函数返回缓冲区所必需的宽字符数，在这种情况下，lpWideCharStr中的缓冲区不被使用。

返回值：

如果函数运行成功，并且cchWideChar不为零，返回值是由lpWideCharStr指向的缓冲区中写入的宽字符数；如果函数运行成功，并且cchWideChar为零，返回值是接收到待转换字符串的缓冲区所需求的宽字符数大小。如果函数运行失败，返回值为零。若想获得更多错误信息，请调用GetLastError函数。它可以返回下面所列错误代码：

ERROR_INSUFFICIENT_BUFFER；ERROR_INVALID_FLAGS；

ERROR_INVALID_PARAMETER；ERROR_NO_UNICODE_TRANSLATION。
注意：

指针lpMultiByteStr和lpWideCharStr必须不一样。如果一样，函数将失败，GetLastError将返回ERROR_INVALID_PARAMETER的值。

如果MB_ERR_INVALID_CHARS被设置并且在资源字符串中遇到无效的字符时，函数将失败。如果MB_ERR_INVALID_CHARS不被设置，或是DBCS串中发现了头字节而没有有效的尾字节，无效字符将转换为缺省字符，但不是资源字符串中的缺省字符。当无效字符被发现，且MB_ERR_INVALID_CHARS值被设置，函数返回零，GetLastErro显示ERROR_NO_UNICODE_TRANSLATION的出错信息。

如果cbhMultiByte为-1，需要注意返回值为包括零字符在内的字符串的总长度比求字符长度函数得到的返回值大1。

Windows CE：不支持参数CodePage中的CP_UTF7和CP_UTF8的值，以及参数dwFlags中的WC_NO_BEST_FIT_CHARS值。

直接上代码：

#include <iostream>
#include <Windows.h>
using namespace std;

int main()
{
	char bytes[]="HelloWorld";
	int WideCharLen=MultiByteToWideChar(CP_ACP,0,bytes,-1,NULL,0); //获取 待转换字符串的缓冲区所需求的宽字符数大小，包括'\0'（因为第四个参数设置为-1）

	wchar_t *pwstr=new wchar_t[WideCharLen]; //分配WideCharLen大小的空间用于存放 待转换的UICODE字符串
	wmemset(pwstr,0,WideCharLen);
	
	MultiByteToWideChar(CP_ACP,0,bytes,-1,pwstr,WideCharLen); //将以空字符终止的多字节字符串转换成UNICODE字符串

	wcout<<pwstr<<endl; //输出该UNICODE字符串
	
	delete []pwstr; //释放空间
	pwstr=NULL; //将pwstr置NULL
	
	return 0;
}

2.用于UNICODE字符串转换成多字节字符串

int
WINAPI
WideCharToMultiByte(
    __in UINT     CodePage,    //指定执行转换的代码页
    __in DWORD    dwFlags,   //允许你进行额外的控制，它会影响使用了读音符号（比如重音）的字符
    __in_ecount(cchWideChar) LPCWSTR lpWideCharStr, //指定要转换为宽字节字符串的缓冲区
    __in int      cchWideChar, //指定由参数lpWideCharStr指向的缓冲区的字符个数（如果lpWideCharStr指定的字符串以空字符终止，可以设置为-1）
    __out_bcount_opt(cbMultiByte) __transfer(lpWideCharStr) LPSTR   lpMultiByteStr,   //指向接收被转换字符串的缓冲区
    __in int      cbMultiByte,      //指定由参数lpMultiByteStr指向的缓冲区最大值
    __in_opt LPCSTR   lpDefaultChar,            //遇到一个不能转换的字符，函数便会使用pDefaultChar参数指向的字符
    __out_opt LPBOOL lpUsedDefaultChar);    //至少有一个字符不能转换为其多字节形式，函数就会把这个变量设为TRUE

函数功能：将一个UNICODE字符串转换成多字节字符串

返回值：如果函数运行成功，并且cchMultiByte不为零，返回值是由 lpMultiByteStr指向的缓冲区中写入的字节数；如果函数运行成功，并且cchMultiByte为零，返回值是接收到待转换字符串的缓冲区所必需的字节数。如果函数运行失败，返回值为零。若想获得更多错误信息，请调用GetLastError函数。它可以返回下面所列错误代码：

ERROR_INSUFFICIENT_BJFFER；ERROR_INVALID_FLAGS；

ERROR_INVALID_PARAMETER；ERROR_NO_UNICODE_TRANSLATION。

注意：指针lpMultiByteStr和lpWideCharStr必须不一样。如果一样，函数将失败，GetLastError将返回ERROR_INVALID_PARAMETER的值。　

直接上代码：

#include <iostream>
#include <string>
#include <Windows.h>
using namespace std;

int main()
{	
	wchar_t wstr[]=L"HelloWorld";
	int MultiByteLen=WideCharToMultiByte(CP_ACP,0,wstr,-1,NULL,0,NULL,0); //获取接收到待转换字符串的缓冲区所需求的字节数，包括'\0'（因为第四个参数设置为-1）

	char *pbytes=new char[MultiByteLen]; //分配MultiByteLen大小的空间用于存放待转换的多字节字符串
	memset(pbytes,0,MultiByteLen);

	WideCharToMultiByte(CP_ACP,0,wstr,-1,pbytes,MultiByteLen,NULL,NULL); 将以空字符终止的UNICODE字符串转换成多字节的字符串
	
	string str=pbytes;
	cout<<str<<endl; //输出该多字节 字符串
	
	delete pbytes; //释放空间
	pbytes=NULL; //将pbytes置NULL
	return 0;
}