基本字符类型
char、 CHAR、 WCHAR、 TCHAR
char是C语言标准数据类型,字符型,至于由几个字节组成通常由编译器决定,一般一个字节。Windows为了消除各编译器的差别,重新定义了一些数据类型。
CHAR为单字节字符。
WCHAR为Unicode字符,即不论中英文,每个字符有两个字节组成。
如果当前编译方式为ANSI(默认)方式,TCHAR等价于CHAR,如果为Unicode方式,TCHAR等价于WCHAR。
BSTR、 LPSTR、 LPWSTR、 LPCSTR、 LPTSTR、 LPCTSTR
BSTR (Basic STRing) 实际上就是一个COM字符串, COM是一种跨编程语言的平台,需要提供语言无关的数据类型。 C++ 字符串是以0结束的ASCII或Unicode字符数组。 Visual Basic字符串是一个ASCII字符数组加上表示长度的前缀。 Java字符串是以0结束的Unicode字符数组。
LPSTR被定义成是一个指向以NULL(‘\0’)结尾的8位 ANSI 字符数组指针。
LPWSTR是一个指向以NULL结尾的16位双字节字符数组指针。
LPCSTR 等价于 const char *。
LPTSTR 在ANSI方式下等价于 LPSTR, Unicode方式下等价于LPWSTR。
LPCTSTR在ANSI方式下等价于 LPCSTR, Unicode方式下等价于LPCWSTR。
CString、 CStringA 、CStringW
Visual C++.NET中将CStringT作为ATL和MFC的共享的“一般”字符串类。它里面包含了三个值:一个指向某个数据缓冲区的指针、一个是该缓冲中有效的字符记数以及一个缓冲区长度。 有效字符数的大小可以是从0到该缓冲最大长度值减1之间的任何数(因为字符串结尾有一个NULL字符)。字符记数和缓冲区长度被巧妙隐藏。它有CString、CStringA和CStringW三种形式,分别操作不同字符类型的字符串。这些字符类型是TCHAR、char和wchar_t。TCHAR在Unicode平台中等同于WCHAR(16位 Unicode字符),在ANSI中等价于char。wchar_t通常定义为unsigned short。
相互转换
char*转换成CString
方法一,可以直接赋值,如: ① CString myString = "This is a test";
② CString myString = _T("This is a test"); // Unicode-aware
③ TCHAR * p = _T("This is a test"); // Unicode-aware
CString myString = p;
方法二,可以利用构造函数,如:CString s1("Tom");
CString转换成char*(LPSTR)
方法一,使用强制转换。例如: CString theString( “This is a test” );
LPTSTR lpsz =(LPTSTR)(LPCTSTR)theString;
方法二,使用strcpy。例如: CString theString( “This is a test” );
LPTSTR lpsz = new TCHAR[theString.GetLength()+1];
_tcscpy(lpsz, theString);
需要说明的是,strcpy(或可移值Unicode/MBCS的_tcscpy)的第二个参数是 const wchar_t* (Unicode)或const char* (ANSI),系统编译器将会自动对其进行转换。
方法三,使用CString::GetBuffer。例如: CString s(_T(”This is a test “));
LPTSTR p = s.GetBuffer();
// 在这里添加使用p的代码
if(p != NULL) *p = _T(’\0′);
s.ReleaseBuffer();
// 使用完后及时释放,以便能使用其它的CString成员函数
CString类向const char *转换
char a[100];
CString str("aaaaaa");
strncpy(a,(LPCTSTR)str,sizeof(a));
或者如下:
strncpy(a,str,sizeof(a));
以上两种用法都是正确地. 因为strncpy的第二个参数类型为const char *.所以编译器会自动将CString类转换成const char *
CString转LPCTSTR (const char *)
CString cStr;
const char *lpctStr=(LPCTSTR)cStr;
LPCTSTR转CString
LPCTSTR lpctStr;
CString cStr=lpctStr
CString 型转化成 BSTR 型
CString s;
s = ... ; // whatever
BSTR b = s.AllocSysString();
现在指针 b 指向的就是一个新分配的 BSTR 对象,该对象是 CString 的一个拷贝,包含终结 NULL字符。现在你可以将它传递给任何需要 BSTR 的接口。通常,BSTR 由接收它的组件来释放,如果你需要自己释放 BSTR 的话,可以这么做:
::SysFreeString(b);
BSTR 型转化成 CString 型
BSTR b;
b = ...; // whatever
CString s(b == NULL ? L"" : b)
ANSI、Unicode和宽字符之间的转换
方法一,使用MultiByteToWideChar将ANSI字符转换成Unicode字符,使用WideCharToMultiByte将Unicode字符转换成ANSI字符。
BOOL MByteToWChar(LPCSTR lpcszStr, LPWSTR lpwszStr, DWORD dwSize)
{
// Get the required size of the buffer that receives the Unicode
// string.
DWORD dwMinSize;
dwMinSize = MultiByteToWideChar (CP_ACP, 0, lpcszStr, -1, NULL, 0);
if(dwSize < dwMinSize)
{
return FALSE;
}
// Convert headers from ASCII to Unicode.
MultiByteToWideChar (CP_ACP, 0, lpcszStr, -1, lpwszStr, dwMinSize);
return TRUE;
}
BOOL WCharToMByte(LPCWSTR lpcwszStr, LPSTR lpszStr, DWORD dwSize)
{
DWORD dwMinSize;
dwMinSize = WideCharToMultiByte(CP_OEMCP,NULL,lpcwszStr,-1,NULL,0,NULL,FALSE);
if(dwSize < dwMinSize)
{
return FALSE;
}
WideCharToMultiByte(CP_OEMCP,NULL,lpcwszStr,-1,lpszStr,dwSize,NULL,FALSE);
return TRUE;
}
方法二,使用“_T”将ANSI转换成“一般”类型字符串,使用“L”将ANSI转换成Unicode,而在托管C++环境中还可使用S将ANSI字符串转换成String*对象。例如:
TCHAR tstr[] = _T(”this is a test”);
wchar_t wszStr[] = L”This is a test”;
String* str = S”This is a test”;
方法三,使用ATL 7.0的转换宏和类。ATL7.0在原有3.0基础上完善和增加了许多字符串转换宏以及提供相应的类,它具有如图3所示的统一形式:
其中,第一个C表示“类”,以便于ATL 3.0宏相区别,第二个C表示常量,2表示“to”,EX表示要开辟一定大小的缓冲。SourceType和DestinationType可以是A、 T、W和OLE,其含义分别是ANSI、Unicode、“一般”类型和OLE字符串。例如,CA2CT就是将ANSI转换成一般类型的字符串常量。下面 是一些示例代码:
LPTSTR tstr= CA2TEX<16>(”this is a test”);
LPCTSTR tcstr= CA2CT(”this is a test”);
wchar_t wszStr[] = L”This is a test”;
char* chstr = CW2A(wszStr);