WCHAR,CHAR,TCHAR的区别

最新推荐文章于 2024-06-30 17:13:32 发布

Allen_Kao

最新推荐文章于 2024-06-30 17:13:32 发布

阅读量1.1k

点赞数

分类专栏： C/C++

本文链接：https://blog.csdn.net/gsls181711/article/details/17113137

版权

C/C++ 专栏收录该内容

36 篇文章 1 订阅

订阅专栏

因为C++支持两种字符串，即常规的ANSI编码（使用""包裹）和Unicode编码（使用L""包裹），这样对应的就有了两套字符串字符串处理函数，比如：strlen和wstrlen，分别用于处理两种字符串 　　微软将这两套字符集及其操作进行了统一，通过条件编译（通过_UNICODE和UNICODE宏）控制实际使用的字符集，这样就有了_T("")这样的字符串，对应的就有了_tcslen这样的函数 　　为了存储这样的通用字符，就有了TCHAR：当没有定义_UNICODE宏时，TCHAR = char，_tcslen = strlen 当定义了_UNICODE宏时，TCHAR = wchar_t ， _tcslen = wstrlen 　　当我们定义了UNICODE宏，就相当于告诉了编译器：我准备采用UNICODE版本。这个时候，TCHAR就会摇身一变，变成了wchar_t。而未定义UNICODE宏时，TCHAR摇身一变，变成了unsigned char 。这样就可以很好的切换宽窄字符集。tchar可用于双字节字符串，使程序可以用于中日韩等国 语言文字处理、显示。使编程方法简化。

现在C++的字符分成两种类型wchar_t和char。   
其中   WCHAR==wchar_t，CHAR==char。   
TCHAR是一种条件编译的类型，根据条件可以代表wchar_t或char。  
CHAR实施上就是unsigned char,
WCHAR为宽字符，
而TCHAR根据是否支持unicode而不同。 
在程序使用sizeof(TCAHR)，当默认设置时，这个值是1；
当定义UNICODE宏时，这个值是2。
BSTR是BASICA中的字符串在C++中的表示方法，它是一种带有字符计数的wchar_t类型的字符串，SysAllocString,   SysFreeString这两个函数是Windows中专门处理BSTR的函数(属于COM函数）。   
    
各种类型之间是可以进行强制转换的（有些有专有的函数比如wchar_t和char的相互转换）
/
WCHAR,CHAR,TCHAR的关系实际上是这样的   
    
#ifdef   UNICODE     
          typedef   wchar_t   TCHAR;     
#else     
          typedef   unsigned   char   TCHAR;     
#endif     
      
typedef   unsigned   char   CHAR;     
typedef   unsigned   wchar_t   WCHAR;     
    
//wchar_t   16-bit   predefined   type   for   wide   characters.   Unsigned     
    
A   BSTR,   known   as   basic   string   or   binary   string,   is   a   pointer   to   a   wide   character   string   used   by   Automation   data   manipulation   functions.   
    
typedef   OLECHAR   FAR*   BSTR;   
      
BSTRs   are   wide,   double-byte   (Unicode)   strings   on   32-bit   Windows   platforms   and   narrow,   single-byte   strings   on   the   Apple&reg;   PowerMac&#8482;.   
    
因而不能直接进行强制转换，系统提供了一些宏进行转换如OLE2T,T2OLE。   
另外   BSTR   并在   COM   对象之间传递它们时，必须小心地处理它们所使用的内存以避免内存泄漏。当   BSTR   停留在接口中时，在完成其使用后必须释放出它的内存。但是，如果   BSTR   传递出了接口，那么接收对象将负责它的内存管理。管理的函数就诸如SysAllocString,   SysFreeString。BSTR是一个比较复杂的数据类型，系统有许多关于他的操作和封装对象，应该看一些有关方面的书。其他的问题请提的具体些，并且多给一点分。
//
1.char* to wchar* 
WCHAR* ToWChar(char * str) 

{ 
static WCHAR buffer[1024]; 

wcsset(buffer,0); 

MultiByteToWideChar(CP_ACP,0,str,strlen(str),buffer,1024); 

return buffer; 

} 
2 wchar* to char* 
(1)use WideCharToMultiByte 

uchar wszSomeString[1024]; 

char szANSIString [MAX_PATH]; 

WideCharToMultiByte ( CP_ACP, WC_COMPOSITECHECK, wszSomeString, -1, szANSIString, sizeof(szANSIString), NULL, NULL ); 

(2)use W2A: 

USES_CONVERSION; 

pTemp=W2A(wszSomeString);     
    
    
///
1. char * --> UNICODE WCHAR * 
CComBSTR bstr(str); 

2. UNICODE WCHAR*到 char * 
CString str(wchar*);

 
 
char 8 字节 ：
char *p = "hello";
char p[] = "hello";
宽字符 
typedef unsigned short wchar_t;   
wchar_t 16 字节；
wchar_t c = 'A';
wchar_t Cw = L"hello";   14 字节 --->最后还有一个0;
L : 告诉编译器，按宽字符保存；strlen(const char*)     //用于计算单字符的长度
wcslen(const wchar_t*); //用于计算宽字符的长度。
strlen(p);          如果两个混用将出现错误；             
wcslen(cw);          ---〉== 6;(自动去掉末尾的0)
还有一些函数：
wprintf, ----printf
wsprintf, ----sprintf
wvsprintf ----vsprintf
 
 
获取长度:
LPCTSTR strTmp : lstrlen( LPCTSTR lpString ); 
char *strTmp : strlen( const char *string ); 
_bstr_t strTmp : wcslen( const wchar_t *string );