Windows中的宽字符串处理问题

在用VC做开发的时候,对于一些字符串,会经常调用一般_t、_T、T(),其实这些东西都和Unicode有关系。比如说,AfxMessageBox(_T("Error! Fail to connect the database!"));这里用到了一个_T(),不使用_T()有时候编译会报错。

Windows操作系统使用Unicode作为默认的文本编码格式。Unicode定义了对大于8位的字符编码的支持。Windows使用UTF-16格式,称为宽字符编码,UTF-16编码以16位无符号整数为单位,每个字符占用两个字节。许多Windows函数都定义了两个入口点Unicode版本入口函数以W字符结尾,表示的是针对宽字符的;ANSI字符入口点函数则以A结尾。比如说,对于CreateMutex()存在CreateMutexW()和CreateMutexA()。编译的时候根据是否定义了Unicode进行适当的函数调用。Windows内部使用的是宽字符,ANSI入口点实际上只是在宽字符版本函数调用之外加上包装,进行适当的字符串转换。

16位字符类型为wchar_t,可以代替char类型。WCHAR是定义宽字符的等价形式,在源代码中字符串都被解释成8位的ANSI字符,所以需要将其指定为宽字符,可以使用L说明符或者宏TEXT()来指定。

wchar_t str1[]=L”some text”;WCHAR st2[]=TEXT(“moretext”);

在定义了Unicode的情况下,TEXT()宏很有用,它会将字符串转换为宽字符格式;在未定义Unicode的情况下,它让字符串保留8位ANSI文本格式。TCHAR类型与之类似,定义了Unicode时,解析为wchar_t,否则解析成char。

有些函数也会根据是否定义了Unicode而采用不同的解析方式的宏。比如说,主函数_tmain()在定义UNICODE的情况下,解析为wmain(),否则解析为main();_tprintf()在定义了Unicode的情况下解析为wprintf(),否则解析成printf()。

其实在使用_tmain的时候,利用Goto Definition可以看到,在stdafx.h里面有这么一行,#include <tchar.h>,所以使用_tmain()的时候必须使用#include<tchar.h>,在头文件<tchar.h>里找到_tmain的宏定义,

#define _tmain         main

经过预编译以后,_tmain就变成main了。main()是标准C++的函数入口。标准C++的程序入口点函数,默认字符编码格式ANSI函数原型为:

int main();

int main(int argc, char* argv[]);

_tmain()是windows提供的对Unicode字符集和ANSI字符集进行自动转换用的程序入口点函数,其原型为int _tmain(int argc, TCHAR *argv[])。

当程序当前的字符集为Unicode时,int _tmain(int argc, TCHAR *argv[])会被翻译成

int wmain(int argc, wchar_t *argv[]);当程序当前的字符集为ANSI时,int_tmain(int argc, TCHAR *argv[])会被翻译成int main(int argc, char *argv[])。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值