一直对VC中文本数据类型有很多疑惑,在用COM的时候,发现疑惑更大了,MS繁杂的字符数据类型,大概也从一个侧面反映了Windows历程的一点足迹和计算机在最近10几年的发展.今天抽个时间总结一下.以下大部分非本人原创,只是收集整理自《深入解析ATL》和《COM本质论》.希望能对这方面有疑惑的同学有帮助.说实话,我感觉掌握了这些,对掌握象VB,JAVA这些语言及其机制就非常容易了,因为他们都比这简单的多,甚至为了追求傻瓜化隐藏了很多功能,这大概就是人们常说的"会了VC学其他的就非常容易"的原因吧~~(另外希望结识更多对COM感兴趣或精通COM的兄弟们,大家一起进步.QQ:119512108)
引:
COM中除了C中数字类型,另外有三种:1.文本字符串(BSTR形式);2.VARIANT;3.接口指 针(如智能指针类).
标准文本数据类型的必要:不同或同一COM组件可能运行在使用不同文本数据类型的操作上,并且不同类型的COM组件的相互通信.
一.Windows四种字符数据类型:
1.ANSI :大体与ASCII相同,也称单字节字符集(SBCS).8位.C/C++中使用char数组表示串.
2.Unicode :把字符表示为宽字符(wide-character),16位.C/C++中使用wchar_t数组 表示宽串.
3.MBCS/DBCS :多字节字符集(MBCS),是一种混和长度的字符集,Windows 9x一般使用 MBCS;双字节字符集(DBCS),英文用ANSI表示,中,韩等用Unicode. C/C++中使用unsigned char数组表示串.在VC++中MBCS即为DBCS.
4.TCHAR/_TCHAR :由MS自定义的通用文本数据类型,可以使用不同的编译选项分别映射到ANSI,Unicode,MBCS.它用来编写通用的代码!! C运行库定义了_TCHAR类型,Windows操作系统定义了TCHAR类型,它们是相同的.(ANSI C/C++编译器要求实现者定义的名字以下划线作为前缀,一般去掉"_"就是系统API定义的形式.当没定义_STDC_,表示不需要遵守ANSI标准.)
二.COM字符数据类型:
1.OLECHAR :COM中所有字符都用OLECHAR数据类型表示,COM文本字符串是一个以NUL字符作为结束的OLECHAR字符数组.LPOLECHAR为其指针形式.对于Win32系统,为wchar_t字符类型(即Unicode类型);对于Win16,为char类型;对Solaris OS为wchar_t类型.
2.BSTR :一个包含长度前缀的OLECHAR数组的指针.凡是要在VB,JAVA中用到的接口,都必须使用BSTR字符串类型.
三.(ATL中)字符转换宏:
1.
T表示指向Win32 TCHAR字符类型的指针----LPTSTR参数
W表示指向Unicode wchar_t字符类型的指针---LPWSTR参数
A表示指向MBCS/ANSI char字符类型的指针----LPSTR参数
OLE表示指向COM OLECHAR字符类型的指针-----LPOLESTR参数
C表示C/C++中的const修饰符
2.宏格式 :<源类型缩写>2<目标类型缩写>.如A2W宏把一个LPSTR转换为LPWSTR;T2BSTR表示把LPTSTR转换为BSTR.
四.不得不提的VARIANT(变体):
VARIANT是一个格式集合,它能使用户在不知道方法所要求的数据类型的情况下向它传递参数(即可以传回一个类型模糊的参数,通过传回的VARIANT的不同参数VT(鉴别器参数)辨别具体数据类型).以鉴别器(discriminator)和集合(union)一起提供给用户.
这里只讨论原理性的东西,具体函数和类的用法,MSDN是最好的老师!