Ansi 与 Unicode编码格式(2)

一、不同编码格式下的字符串处理及相互转换
1. Ansi
charchar *const char *
CHAR、(PCHAR、PSTR、LPSTR)、LPCSTR
2. Unicode
wchar_twchar_t *const wchar_t *
WCHAR、(PWCHAR、PWSTR、LPWSTR)、LPCWSTR
3. T 通用类型
TCHAR、(TCHAR * 、PTCHAR、PTSTR、LPTSTR)、LPCTSTR

P代表指针的意思,STR代表字符串的意思,L是长指针的意思,在WIN32平台下可以忽略,C代表const常量的意思,W代表wide宽字节的意思,T大家可以理解为通用类型的意思,
就是可以根据工程中是否定义_UNICODE 宏,分别定义成不同的类型,比如:TCHAR 类型,如果工程中定义了_UNICODE 宏,那么他最终被定义成 wchar_t 类型,
如果工程中没有定义_UNICODE 宏,那么 TCHAR 被最终定义成 char 类型。

注意:建议使用通用类型,这样在修改代码后不需要进行修改代码

二、字符串类型的对象的定义
  • Ansi:char *pAnsiStr = “hello”;
  • Unicode:wchar_t *pUnicodeStr = L"hello";
  • 通用类型:TCHAR *pTStr = _T(“hello”); 或者 TCHAR *pTStr = _TEXT(“hello”);
  • 动态申请内存:TCHAR *pszBuf = new TCHAR[100];

注意:_TEXT和_T是一样的,可以去看定义

三、常用的字符串处理函数
1. 字符串长度
● Ansi:strlen(char *str);
● Unicode:wcslen(wchar_t *str);
● 通用函数:_tcslen(TCHAR *str);

● Ansi:int atoi(const char *str);
● Unicode:int _wtoi(const wchar_t *str);
● 通用函数:_tstoi(const TCHAR *str);
2. 字符串拷贝
● Ansi:strcpy(char *strDestination, const char *strSource);
● Unicode:wcscpy(wchar_t *strDestination, const wchar_t *strSource);
● 通用函数:_tcscpy(TCHAR *strDestination, const TCHAR *strSource);

上面函数不安全,在VS 2013版中会Waring警告,使用下面函数:(VC++ 6.0不支持)

● Ansi:strcpy_s(char *strDestination, size_t numberOfElements, const char *strSource);
● Unicode:wcscpy_s(wchar_t *strDestination, size_t numberOfElements, const wchar_t *strSource);
● 通用函数:_tcscpy_s(TCHAR *strDestination, size_t numberOfElements, const TCHAR *strSource);
4. 字符串占用字节数
  • Ansi
char szStr[] = "abc";
占用字节数求法:sizeof(szStr);

char *psz = "defgh";
占用字节数求法:strlen(psz)*sizeof(char);
  • Unicode
wchar_t szwStr[] = L"abc";
占用字节数求法:sizeof(szwStr);

wchar_t *pwsz = L"defgh";
占用字节数求法:wcslen(pwsz)*sizeof(wchar_t);
  • 通用函数.
TCHAR szStr[] = _T("abc");
占用字节数求法:sizeof(szStr);

TCHAR *psz = _T("defgh");
占用字节数求法:_tcslen(psz)*sizeof(TCHAR);
四、Ansi 与 Unicode 字符串类型的互相转换

注意:不是所有的需要进行转换,有一些不需要转换的,比如socket中的send或者recv函数

1. 使用 API 函数

WideCharToMultiByte 实现宽字节转换到窄字节,MultiByteToWideChar 实现窄字节转换到宽字节

int
WINAPI
MultiByteToWideChar(
    _In_ UINT CodePage,
    _In_ DWORD dwFlags,
    _In_NLS_string_(cbMultiByte) LPCCH lpMultiByteStr,
    _In_ int cbMultiByte,
    _Out_writes_to_opt_(cchWideChar,return) LPWSTR lpWideCharStr,
    _In_ int cchWideChar
    );
参数一:CP_ACP 和 CP_UTF8
使用 CP_ACP 代码页就实现了 ANSI 与 Unicode 之间的转换;--- 使用
使用 CP_UTF8 代码页就实现了 UTF-8 与 Unicode 之间的转换。
参数二:
dwFlags 参数允许我们进行额外的控制,但是,一般情况下都不使用这个标志,直接传递 0 就行了。
参数三:
lpDefaultChar和pfUsedDefaultChar:只有当WideCharToMultiByte函数遇到一个宽字节字符,而该字符在uCodePage参数标识的代码页中并没有它的表示法时,WideCharToMultiByte函数才使用这两个参数。如果宽字节字符不能被转换,该函数便使用lpDefaultChar参数指向的字符。如果该参数是NULL(这是大多数情况下的参数值),那么该函数使用系统的默认字符。该默认字符通常是个问号。这对于文件名来说是危险的,因为问号是个通配符。pfUsedDefaultChar参数指向一个布尔变量,如果Unicode字符串中至少有一个字符不能转换成等价多字节字符,那么函数就将该变量置为TRUE。如果所有字符均被成功地转换,那么该函数就将该变量置为FALSE。当函数返回以便检查宽字节字符串是否被成功地转换后,可以测试该变量。 

封装转换函数:

//宽字节转换到窄字节
char *WideCharToAnsi(wchar_t *pWideChar)
{
	if (!pWideChar) return NULL;
	char *pszBuf = NULL;
	int needBytes = WideCharToMultiByte(CP_ACP, 0, pWideChar, -1, NULL, 0, NULL, NULL);
	if (needBytes > 0){
		pszBuf = new char[needBytes+1];
		ZeroMemory(pszBuf, (needBytes+1)*sizeof(char));
		WideCharToMultiByte(CP_ACP, 0, pWideChar, -1, pszBuf, needBytes, NULL, NULL);
	}

	return pszBuf;
}

//窄字节转换到宽字节
wchar_t *AnsiCharToWide(char *pChar)
{
	if (!pChar) return NULL;
	wchar_t *pszBuf = NULL;
	int needWChar = MultiByteToWideChar(CP_ACP, 0, pChar, -1, NULL, 0);
	if (needWChar > 0){
		pszBuf = new wchar_t[needWChar+1];
		ZeroMemory(pszBuf, (needWChar+1)*sizeof(wchar_t));
		MultiByteToWideChar(CP_ACP, 0, pChar, -1, pszBuf, needWChar);
	}

	return pszBuf;
}
//调用过程
char* pResult=_T("你好");
wchar_t * pBuff=AnsiCharToWide(pResult);

wchar_t* pResult=_T("你好");
wchar_t * pBuff=WideCharToAnsi(pResult);
2. 使用A2W、W2A、T2A、T2W 宏

注意:不要在一函数的循环体中使用A2W等字符转化宏,可能引起栈溢出
分配的内存是在函数的栈中分配的。而VC编译器默认的栈内存空间是2M。当在一个函数中循环调用它时就会不断的分配栈中的内存。会导致栈溢出的。

//调用过程
char* pResult=_T("你好");
USES_CONVERSION;
wchar_t * pBuff=A2W(pResult);

推荐使用最根本的 API 函数,进行Ansi与Unicode之间的转换

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值