因为C++支持两种字符串,即常规的ANSI编码(使用""包裹)和Unicode编码(使用L""包裹),这样对应的就有了两套字符串字符串处理函数,比如:strlen和wstrlen,分别用于处理两种字符串 微软将这两套字符集及其操作进行了统一,通过条件编译(通过_UNICODE和UNICODE宏)控制实际使用的字符集,这样就有了_T("")这样的字符串,对应的就有了_tcslen这样的函数 为了存储这样的通用字符,就有了TCHAR:当没有定义_UNICODE宏时,TCHAR = char,_tcslen = strlen 当定义了_UNICODE宏时,TCHAR = wchar_t , _tcslen = wstrlen 当我们定义了UNICODE宏,就相当于告诉了编译器:我准备采用UNICODE版本。这个时候,TCHAR就会摇身一变,变成了wchar_t。而未定义UNICODE宏时,TCHAR摇身一变,变成了unsigned char 。这样就可以很好的切换宽窄字符集。tchar可用于双字节字符串,使程序可以用于中日韩等国 语言文字处理、显示。使编程方法简化。
现在C++的字符分成两种类型wchar_t和char。 其中 WCHAR==wchar_t,CHAR==char。 TCHAR是一种条件编译的类型,根据条件可以代表wchar_t或char。
CHAR实施上就是unsigned char, WCHAR为宽字符, 而TCHAR根据是否支持unicode而不同。 在程序使用sizeof(TCAHR),当默认设置时,这个值是1; 当定义UNICODE宏时,这个值是2。
BSTR是BASICA中的字符串在C++中的表示方法,它是一种带有字符计数的wchar_t类型的字符串,SysAllocString, SysFreeString这两个函数是Windows中专门处理BSTR的函数(属于COM函数)。 各种类型之间是可以进行强制转换的(有些有专有的函数比如wchar_t和char的相互转换)
/
WCHAR,CHAR,TCHAR的关系实际上是这样的 #ifdef UNICODE typedef wchar_t TCHAR; #else typedef unsigned char TCHAR; #endif typedef unsigned char CHAR; typedef unsigned wchar_t WCHAR; //wchar_t 16-bit predefined type for wide characters. Unsigned A BSTR, known as basic string or binary string, is a pointer to a wide character string used by Automation data manipulation functions. typedef OLECHAR FAR* BSTR; BSTRs are wide, double-byte (Unicode) strings on 32-bit Windows platforms and narrow, single-byte strings on the Apple® PowerMac™. 因而不能直接进行强制转换,系统提供了一些宏进行转换如OLE2T,T2OLE。 另外 BSTR 并在 COM 对象之间传递它们时,必须小心地处理它们所使用的内存以避免内存泄漏。当 BSTR 停留在接口中时,在完成其使用后必须释放出它的内存。但是,如果 BSTR 传递出了接口,那么接收对象将负责它的内存管理。管理的函数就诸如SysAllocString, SysFreeString。BSTR是一个比较复杂的数据类型,系统有许多关于他的操作和封装对象,应该看一些有关方面的书。其他的问题请提的具体些,并且多给一点分。
//
1.char* to wchar* WCHAR* ToWChar(char * str) { static WCHAR buffer[1024]; wcsset(buffer,0); MultiByteToWideChar(CP_ACP,0,str,strlen(str),buffer,1024); return buffer; } 2 wchar* to char* (1)use WideCharToMultiByte uchar wszSomeString[1024]; char szANSIString [MAX_PATH]; WideCharToMultiByte ( CP_ACP, WC_COMPOSITECHECK, wszSomeString, -1, szANSIString, sizeof(szANSIString), NULL, NULL ); (2)use W2A: USES_CONVERSION; pTemp=W2A(wszSomeString); ///
1. char * --> UNICODE WCHAR * CComBSTR bstr(str); 2. UNICODE WCHAR*到 char * CString str(wchar*);
char 8 字节 :
char *p = "hello";
char p[] = "hello";
宽字符
typedef unsigned short wchar_t;
wchar_t 16 字节;
wchar_t c = 'A';
wchar_t Cw = L"hello"; 14 字节 --->最后还有一个0;
L : 告诉编译器,按宽字符保存;strlen(const char*) //用于计算单字符的长度
wcslen(const wchar_t*); //用于计算宽字符的长度。
strlen(p); 如果两个混用将出现错误;
wcslen(cw); ---〉== 6;(自动去掉末尾的0)
还有一些函数:
wprintf, ----printf
wsprintf, ----sprintf
wvsprintf ----vsprintf获取长度:
LPCTSTR strTmp : lstrlen( LPCTSTR lpString ); char *strTmp : strlen( const char *string ); _bstr_t strTmp : wcslen( const wchar_t *string );