Unicode与多字符集的区别、使用及相关函数

一、定义

Unicode:使用两字节或2n个字节进行全球统一字符编码;

MBCS:多字节字符集,以ANSI标准为例。以不定长编码字符,遇到ASCII时以单字节编码,遇到其他字符时使用多字节编码,因此可能引起不同语言的乱码显示;


二、VS开发

注意工程属性是基于Unicode,还是基于MBCS进行的开发;

推荐使用Unicode编码,调用与字符串操作有关的函数或类时注意其参数要求为宽字符还是多字节编码,例如

在Unicode背景下,CString str被定义为宽字符,而system函数接受const char*,此时调用system(str)出现错误;

开发中多使用与T有关的兼容宏定义:如_T等,它由编译器决定使用Unicode还是MBCS,例如

_T("this is a compatible str");


三、特别注意在进行数据交互时,可能双方使用不同的编码方式,此时要进行适当转换,提高移植性;

例如,使用Unicode编码,MFC窗体的控件都是宽字符型,若此时与之交互的对方使用MBCS,则此时界面显示与远端传送数据时需要转换;


四、相关函数

//宽字符转多字节

char* CSelfShutdownDlg::MyWideCharToMultiByte(CString str)
{
	//方法1:使用API:WideCharToMultiByte进行转换(使用过,有效)
	int n = str.GetLength(); //按字符计算,str的长度
	int len = WideCharToMultiByte(CP_ACP,0,str,n,NULL,0,NULL,NULL);//按Byte计算str长度
	char *pChStr = new char[len+1];//按字节为单位
	WideCharToMultiByte(CP_ACP,0,str,n,pChStr,len,NULL,NULL);//宽字节转换为多字节编码
	pChStr[len] = '\0';//不要忽略末尾结束标志
	//用完了记得delete []pChStr,防止内存泄露	
	return pChStr;
}
//或者使用T2A、W2A、A2W等函数

USES_CONVERSION;
char* str = W2A();//宽字符转多字节




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值