关闭

WCHAR,CHAR,TCHAR的区别

571人阅读 评论(0) 收藏 举报
分类:
因为C++支持两种字符串,即常规的ANSI编码(使用""包裹)和Unicode编码(使用L""包裹),这样对应的就有了两套字符串字符串处理函数,比如:strlen和wstrlen,分别用于处理两种字符串   微软将这两套字符集及其操作进行了统一,通过条件编译(通过_UNICODE和UNICODE宏)控制实际使用的字符集,这样就有了_T("")这样的字符串,对应的就有了_tcslen这样的函数   为了存储这样的通用字符,就有了TCHAR:当没有定义_UNICODE宏时,TCHAR = char,_tcslen = strlen 当定义了_UNICODE宏时,TCHAR = wchar_t , _tcslen = wstrlen   当我们定义了UNICODE宏,就相当于告诉了编译器:我准备采用UNICODE版本。这个时候,TCHAR就会摇身一变,变成了wchar_t。而未定义UNICODE宏时,TCHAR摇身一变,变成了unsigned char 。这样就可以很好的切换宽窄字符集。tchar可用于双字节字符串,使程序可以用于中日韩等国 语言文字处理、显示。使编程方法简化。


现在C++的字符分成两种类型wchar_t和char。    其中   WCHAR==wchar_t,CHAR==char。    TCHAR是一种条件编译的类型,根据条件可以代表wchar_t或char。  

CHAR实施上就是unsigned char, WCHAR为宽字符, 而TCHAR根据是否支持unicode而不同。  在程序使用sizeof(TCAHR),当默认设置时,这个值是1; 当定义UNICODE宏时,这个值是2。

BSTR是BASICA中的字符串在C++中的表示方法,它是一种带有字符计数的wchar_t类型的字符串,SysAllocString,   SysFreeString这两个函数是Windows中专门处理BSTR的函数(属于COM函数)。         各种类型之间是可以进行强制转换的(有些有专有的函数比如wchar_t和char的相互转换)

/////////////////////////////////////////////////////////////////////////////////////

WCHAR,CHAR,TCHAR的关系实际上是这样的         #ifdef   UNICODE                typedef   wchar_t   TCHAR;      #else                typedef   unsigned   char   TCHAR;      #endif             typedef   unsigned   char   CHAR;      typedef   unsigned   wchar_t   WCHAR;           //wchar_t   16-bit   predefined   type   for   wide   characters.   Unsigned           A   BSTR,   known   as   basic   string   or   binary   string,   is   a   pointer   to   a   wide   character   string   used   by   Automation   data   manipulation   functions.         typedef   OLECHAR   FAR*   BSTR;           BSTRs   are   wide,   double-byte   (Unicode)   strings   on   32-bit   Windows   platforms   and   narrow,   single-byte   strings   on   the   Apple®   PowerMac™.         因而不能直接进行强制转换,系统提供了一些宏进行转换如OLE2T,T2OLE。    另外   BSTR   并在   COM   对象之间传递它们时,必须小心地处理它们所使用的内存以避免内存泄漏。当   BSTR   停留在接口中时,在完成其使用后必须释放出它的内存。但是,如果   BSTR   传递出了接口,那么接收对象将负责它的内存管理。管理的函数就诸如SysAllocString,   SysFreeString。BSTR是一个比较复杂的数据类型,系统有许多关于他的操作和封装对象,应该看一些有关方面的书。其他的问题请提的具体些,并且多给一点分。

//////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////

1.char* to wchar*  WCHAR* ToWChar(char * str)  {  static WCHAR buffer[1024];  wcsset(buffer,0);  MultiByteToWideChar(CP_ACP,0,str,strlen(str),buffer,1024);  return buffer;  }  2 wchar* to char*  (1)use WideCharToMultiByte  uchar wszSomeString[1024];  char szANSIString [MAX_PATH];  WideCharToMultiByte ( CP_ACP, WC_COMPOSITECHECK, wszSomeString, -1, szANSIString, sizeof(szANSIString), NULL, NULL );  (2)use W2A:  USES_CONVERSION;  pTemp=W2A(wszSomeString);                ///////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////

1. char * --> UNICODE WCHAR *  CComBSTR bstr(str);  2. UNICODE WCHAR*到 char *  CString str(wchar*);


char 8 字节 :
char *p = "hello";
char p[] = "hello";
宽字符 
typedef unsigned short wchar_t;   
wchar_t 16 字节;
wchar_t c = 'A';
wchar_t Cw = L"hello";   14 字节 --->最后还有一个0;
L : 告诉编译器,按宽字符保存;strlen(const char*)     //用于计算单字符的长度
wcslen(const wchar_t*); //用于计算宽字符的长度。
strlen(p);          如果两个混用将出现错误;             
wcslen(cw);          ---〉== 6;(自动去掉末尾的0)
还有一些函数:
wprintf, ----printf
wsprintf, ----sprintf
wvsprintf ----vsprintf


获取长度:

LPCTSTR strTmp : lstrlen( LPCTSTR lpString );  char *strTmp : strlen( const char *string );  _bstr_t strTmp : wcslen( const wchar_t *string );  

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:124592次
    • 积分:2185
    • 等级:
    • 排名:第17330名
    • 原创:90篇
    • 转载:93篇
    • 译文:1篇
    • 评论:2条