mbstowcs 和 wcstombs

本文介绍两个由C语言提供的宽字符(wchar_t类型)和多字节字符( 一个字符用一个或者多个字节表示) 转换函数,因此具有通用性(在Windows/Linux系统中都可以使用):

所需头文件:stdlib.h

#include <stdlib.h>

( 1 ) mbstowcs()

功能:

把多字节字符转换成宽字符

原型: 

size_t mbstowcs(
   wchar_t *wcstr,
   const char *mbstr,
   size_t count 
);

参数:

1> wcstr 目标缓存,用来存放转换之后的宽字节字符;当取值为NULL时,返回值为目标缓存所需wchar_t类型的个数

2> mbstr 用来存放待转换的多字节字符串

3> count 用来指定最多转换多少Byte。当wcstr取值为NULL时,该值无用

返回值:

转换成功,且wcstr == NULL时,返回目标缓存所需的大小(wchar_t 类型个数,但不含终结符);

转换成功,且wcstr != NULL时,返回转换的字节数;

转换不成功,返回(size_t) (-1);

使用步骤:

1) 调用mbstowcs()函数,设置参数 wcstr 为NULL(用以获取转换所需的接收缓冲区大小);

2) 给目标缓存区分配足够的内存块,用于存放转换后的wchar_t字符串;

注意:该内存块的大小由首次调用mbstowcs()函数的返回值来决定(该返回值不包含终止符的空间)

3) 再次调用mbstowcs()函数,这次将目标缓存的地址作为 wcstr 参数来传递;

代码示例:

  1. strcpy(sBuf, "我最棒");  
  2. size_t sSize=strlen(sBuf);  
  3.   
  4. wchar_t * dBuf=NULL;  
  5.   
  6. <SPAN style="COLOR: #ff0000">//注意:需要多分配一个空间,以存放终止符</SPAN>   
  7. int dSize=mbstowcs(dBuf, sBuf, 0)+1;  
  8.   
  9. dBuf=new wchar_t[dSize];  
  10. wmemset(dBuf, 0, dSize);  
  11.   
  12. int nRet=mbstowcs(dBuf, sBuf, sSize);  
  13. if(nRet<=0)  
  14. {  
  15.     printf("转换失败\n");  
  16. }  
  17. else  
  18. {  
  19.     printf("转换成功%d字符\n", nRet);  
  20.     wprintf(L"%ls\n", dBuf);  
  21. }  
	strcpy(sBuf, "我最棒");
	size_t sSize=strlen(sBuf);

	wchar_t * dBuf=NULL;
	
	<span style="color:#ff0000;">//注意:需要多分配一个空间,以存放终止符</span>
	int dSize=mbstowcs(dBuf, sBuf, 0)+1;

	dBuf=new wchar_t[dSize];
	wmemset(dBuf, 0, dSize);

	int nRet=mbstowcs(dBuf, sBuf, sSize);
	if(nRet<=0)
	{
		printf("转换失败\n");
	}
	else
	{
		printf("转换成功%d字符\n", nRet);
		wprintf(L"%ls\n", dBuf);
	}
( 2 ) wcstombs()

功能:

把宽字符把转换成多字节字符串

原型:

size_t wcstombs(
   char *mbstr,
   const wchar_t *wcstr,
   size_t count 
);

参数:

1> wcstr 目标缓存,用来存放转换之后的多字节字符;当取值为NULL时,返回值为目标缓存所需wchar_t类型的个数;

2> mbstr 用来存放待转换的宽字符;

3> count 用来指定接收缓存里能够存储的最大的字节数;

返回值:

转换成功,且mbstr == NULL时,返回目标缓存所需的大小(char 类型个数,但不含终结符);

转换成功,且mbstr != NULL时,返回转换的字节数;

转换不成功,返回(size_t)(-1);

注意:

 If wcstombs encounters a wide character it cannot be convert to a multibyte character, it returns –1 cast to type size_t.

使用方法:

与mbstowcs()方法类似

示例代码:

  1. wchar_t sBuf[20]={0};  
  2. wcscpy(sBuf, L"Hello");  
  3. size_t sSize=wcslen(sBuf);  
  4.   
  5.   
  6. char * dBuf=NULL;  
  7.   
  8.   
  9. int dSize=wcstombs(dBuf, sBuf, 0)+1;  
  10. printf("需要%d Char\n", dSize);  
  11.   
  12. dBuf=new char[dSize];  
  13. memset(dBuf, 0, dSize);  
  14.   
  15.   
  16. int nRet=wcstombs(dBuf, sBuf, dSize);  
  17.   
  18. if(nRet<=0)  
  19. {  
  20.     printf("转换失败\n");  
  21. }  
  22. else  
  23. {  
  24.     printf("转换成功%d字符\n", nRet);  
  25.     printf("%s\n", dBuf);  
  26. }  
	wchar_t sBuf[20]={0};
	wcscpy(sBuf, L"Hello");
	size_t sSize=wcslen(sBuf);


	char * dBuf=NULL;


	int dSize=wcstombs(dBuf, sBuf, 0)+1;
	printf("需要%d Char\n", dSize);
	
	dBuf=new char[dSize];
	memset(dBuf, 0, dSize);


	int nRet=wcstombs(dBuf, sBuf, dSize);
	
	if(nRet<=0)
	{
		printf("转换失败\n");
	}
	else
	{
		printf("转换成功%d字符\n", nRet);
		printf("%s\n", dBuf);
	}

上面的代码在转换英文的时候没有问题,在转换中文时,wcstombs()函数会返回-1

注意:

宽字节,即wchar_t 类型采用Unicode编码方式,在Windows中为utf-16,在Linux中为utf-32

而多字节则可能是其他很多编码方式,如utf-8、GB232....

因此,需要指定多字节编码类型,才能进行正常的转换过程。

设置或获取多字节编码方式用函数:setlocale()

所需头文件:locale.h

#include <locale.h>

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值