MultiByteToWideChar和WideCharToMultiByte

最新推荐文章于 2021-12-28 10:26:26 发布

无名无奈

最新推荐文章于 2021-12-28 10:26:26 发布

阅读量272

点赞数

分类专栏： C++

本文链接：https://blog.csdn.net/weixin_40332490/article/details/105089114

版权

C++ 专栏收录该内容

33 篇文章 3 订阅

订阅专栏

1. MultiByteToWideChar

头文件

#include <windows.h>

函数功能：
该函数映射一个字符串到一个宽字符（unicode）的字符串。由该函数映射的字符串没必要是多字节字符组。(此函数把多字节字符串转换成宽字符串(Unicode)，待转换的字符串并不一定是多字节的。)

函数原型：

int MultiByteToWideChar( 　　
UINT CodePage, 　　
DWORD dwFlags, 　　
LPCSTR lpMultiByteStr, 　　
int cchMultiByte, 　　
LPWSTR lpWideCharStr, 　　
int cchWideChar 
);

函数参数
CodePage：指定执行转换的代码页，这个参数可以为系统已安装或有效的任何代码页所给定的值。你也可以指定其为下面的任意一值： (最常用的应该是CP_ACP和CP_UTF8了，前者将宽字符转换为ANSI，后者转换为UTF8)

CP_ACP	ANSI代码页
CP_MACCP	Macintosh代码页
CP_ACP	ANSI代码页
CP_OEMCP	OEM代码页
CP_SYMBOL	符号代码页(42)
CP_THREAD_ACP	当前线索ANSI代码页
CP_UTF7	使用UTF-7转
CP_UTF8	使用UTF-8转换

dwFlags：指定是否转换成预制字符或合成的宽字符，对控制字符是否使用像形文字，以及怎样处理无效字符。
① MB_PRECOMPOSED
总是使用预制字符，即有单个预制字符时，就不会使用分解的基字符和不占空间字符。此为函数的默认选项，不能和MB_COMPOSITE合用
② MB_COMPOSITE
总是使用分解字符，即总是使用基字符+不占空间字符的方式
③ MB_ERR_INVALID_CHARS
设置此选项，函数遇到非法字符就失败并返回错误码 ERROR_NO_UNICODE_TRANSLATION，否则丢弃非法字符
④ MB_USEGLYPHCHARS 使用像形字符代替控制字符
注意：组合字符由一个基础字符和一个非空字符构成，每一个都有不同的字符值。每个预作字符都有单一的字符值给基础/非空字符的组成。在字符è中，e就是基础字符，而重音符标记就是非空字符。　　
函数的缺省动作是转换成预作的形式。如果预作的形式不存在，函数将尝试转换成组合形式。　　
标记MB_PRECOMPOSED和MB_COMPOSITE是互斥的，而标记MB_USEGLYPHCHARS和MB_ERR_INVALID_CHARS则不管其它标记如何都可以设置。
对于下列代码页，dwFlags必须为0，否则函数返回错误码ERROR_INVALID_FLAGS。
50220 50221 50222 50225 50227 50229 52936 54936 57002到57011 65000(UTF7) 42(Symbol)
对于UTF8，dwFlags必须为0或MB_ERR_INVALID_CHARS，否则函数都将失败并返回错误码ERROR_INVALID_FLAGS。

lpMultiByteStr：指向将被转换字符串的字符。

cchMultiByte：指定由参数lpMultiByteStr指向的字符串中字节的个数。如果lpMultiByteStr指定的字符串以空字符终止，可以设置为-1（如果字符串不是以空字符中止，设置为-1可能失败，可能成功），此参数设置为0函数将失败。

lpWideCharStr：指向接收被转换字符串的缓冲区。

cchWideChar：指定由参数lpWideCharStr指向的缓冲区的字符个数。若此值为零，函数返回缓冲区所必需的宽字符数，在这种情况下，lpWideCharStr中的缓冲区不被使用。

返回值
如果函数运行成功，并且cchWideChar不为零，返回值是由lpWideCharStr指向的缓冲区中写入的宽字符数；如果函数运行成功，并且cchMultiByte为零，返回值是接收到待转换字符串的缓冲区所需求的宽字符数大小。如果函数运行失败，返回值为零。若想获得更多错误信息，请调用GetLastError函数。它可以返回下面所列错误代码：　　ERROR_INSUFFICIENT_BUFFER；ERROR_INVALID_FLAGS；　　ERROR_INVALID_PARAMETER；ERROR_NO_UNICODE_TRANSLATION。

注意

指针lpMultiByteStr和lpWideCharStr必须不一样。如果一样，函数将失败，GetLastError将返回ERROR_INVALID_PARAMETER的值。

如果MB_ERR_INVALID_CHARS被设置并且在资源字符串中遇到无效的字符时，函数将失败。如果MB_ERR_INVALID_CHARS不被设置，或是DBCS串中发现了头字节而没有有效的尾字节，无效字符将转换为缺省字符，但不是资源字符串中的缺省字符。当无效字符被发现，且MB_ERR_INVALID_CHARS值被设置，函数返回零，GetLastErro显示ERROR_NO_UNICODE_TRANSLATION的出错信息。

2. WideCharToMultiByte

函数功能
映射一个unicode字符串到一个多字节字符串，执行转换的代码页、接收转换字符串、允许额外的控制等操作。

函数原型

int WideCharToMultiByte(
UINT CodePage, //指定执行转换的代码页
DWORD dwFlags, //允许你进行额外的控制，它会影响使用了读音符号（比如重音）的字符
LPCWSTR lpWideCharStr, //指定要转换为宽字节字符串的缓冲区
int cchWideChar, //指定由参数lpWideCharStr指向的缓冲区的字符个数
LPSTR lpMultiByteStr, //指向接收被转换字符串的缓冲区
int cchMultiByte, //指定由参数lpMultiByteStr指向的缓冲区最大值
LPCSTR lpDefaultChar, //遇到一个不能转换的宽字符，函数便会使用pDefaultChar参数指向的字符
LPBOOL pfUsedDefaultChar //至少有一个字符不能转换为其多字节形式，函数就会把这个变量设为TRUE
);

CP_ACP	ANSI代码页
CP_MACCP	Macintosh代码页
CP_ACP	ANSI代码页
CP_OEMCP	OEM代码页
CP_SYMBOL	符号代码页(42)
CP_THREAD_ACP	当前线索ANSI代码页
CP_UTF7	使用UTF-7转
CP_UTF8	使用UTF-8转换

dwFlags：指定如何处理没有转换的字符，但不设此参数函数会运行的更快一些，我都是把它设为0。可设的值如下表所示：
在这里插入图片描述
返回值
如果函数运行成功，并且cchMultiByte不为零，返回值是由 lpMultiByteStr指向的缓冲区中写入的字节数；如果函数运行成功，并且cchMultiByte为零，返回值是接收到待转换字符串的缓冲区所必需的字节数。如果函数运行失败，返回值为零。若想获得更多错误信息，请调用GetLastError函数。它可以返回下面所列错误代码：
ERROR_INSUFFICIENT_BJFFER；ERROR_INVALID_FLAGS；
ERROR_INVALID_PARAMETER；ERROR_NO_UNICODE_TRANSLATION。

注意
指针lpMultiByteStr和lpWideCharStr必须不一样。如果一样，函数将失败，GetLastError将返回ERROR_INVALID_PARAMETER的值。

无名无奈

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
MultiByteToWideChar和WideCharToMultiByte

头文件#include <windows.h>函数功能：该函数映射一个字符串到一个宽字符（unicode）的字符串。由该函数映射的字符串没必要是多字节字符组。(此函数把多字节字符串转换成宽字符串(Unicode)，待转换的字符串并不一定是多字节的。)函数原型：int MultiByteToWideChar( 　　UINT CodePage, 　　DWORD dwFlag...
复制链接

扫一扫