【原】Windows编程中的字符集编码格式及_T宏的解释

最新推荐文章于 2022-12-08 18:46:44 发布

weixin_34327223

最新推荐文章于 2022-12-08 18:46:44 发布

阅读量67

点赞数

在Windows中，字符集编码有两种：ANSI和Unicode。

ANSI使用单字节，一般用于处理英文，而中文是双字节字符。所以，在处理中文字符时，ANSI编码有时会不方便，出现半个汉字的情况，于是就造成乱码。

Unicode编码使用双字节，即每个字符都占两个字节，这可以很好地兼容汉字。因为不能确定编译完的程序最终会用在什么环境什么字符集上，所有为了提高兼容性，我们一般要在中文字符串前，加宏_T，_TEXT。

比如：_T(”你好，MFC“)

若程序以ANSI格式编译，则_T宏其实没有起任何作用

若程序以Unicode格式编译，则_T会把”你好，MFC“以Unicode格式保存，中英文都被处理。而另一个_L宏则是强制性的以Unicode格式保存（双字节）。_T与_L的区别就在于，一个是适配的，一个是强制的。

wchar_t Str[] = L"Hello World!";
这个就是双子节存储字符了。
_T是一个适配的宏～
当
#ifdef _UNICODE的时候
_T就是L
没有#ifdef _UNICODE的时候
_T就是ANSI的。
比如
LPTSTR lpStr = new TCHAR[32];
TCHAR* szBuf = _T("Hello");

LPSTR：32bit 指针指向一个字符串，每个字符占1 字节

LPCSTR:32-bit 指针指向一个常字符串，每个字符占1 字节

LPCTSTR:32-bit 指针指向一个常字符串,每字符可能占1 字节或2字节，取决于Unicode是否定义

LPTSTR:32-bit 指针每字符可能占1 字节或2字节，取决于Unicode是否定义

LPTSTR lpStr = new TCHAR[32];

TCHAR* szBuf = _T("Hello");

以上两句使得无论是在UNICODE编译条件下都是正确编译的。

而且MS推荐你使用相匹配的字符串函数。

比如处理LPTSTR或者LPCTSTR 的时候，不要用strlen ,而是要用_tcslen

否则在UNICODE的编译条件下，strlen不能处理 wchar_t*的字符串。

T是非常有意思的一个符号（TCHAR、LPCTSTR、LPTSTR、_T()、_TEXT()...），它表示使用一种中间类型，既不明确表示使用 MBCS，也不明确表示使用 UNICODE。那到底使用哪种字符集?

编译的时候才决定

weixin_34327223

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【原】Windows编程中的字符集编码格式及_T宏的解释

在Windows中，字符集编码有两种：ANSI和Unicode。ANSI使用单字节，一般用于处理英文，而中文是双字节字符。所以，在处理中文字符时，ANSI编码有时会不方便，出现半个汉字的情况，于是就造成乱码。Unicode编码使用双字节，即每个字符都占两个字节，这可以很好地兼容汉字。因为不能确定编译完的程序最终会用在什么环境什么字符集上，所有为了提高兼容性，我们一般要在中文字符串前，加宏_...
复制链接

扫一扫