UNICODE与MBCS等字符问题

最新推荐文章于 2021-03-16 00:01:19 发布

lwbeyond

最新推荐文章于 2021-03-16 00:01:19 发布

阅读量1.7k

点赞数

分类专栏： C/C++ 文章标签：编译器 windows 编程存储微软

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lwbeyond/article/details/5410523

版权

C/C++ 专栏收录该内容

45 篇文章 55 订阅

订阅专栏

VS2008默认的字符集是Unicode，而VC6.0默认是多字节字符集，Unicode字符集你要加_T("")或L""，你也可以“

工程-属性-修改字符集”。

１. UNICODE：它是用两个字节表示一个字符的方法。比如字符'A'在ASCII下面是一个字符，可'A'在UNICODE下面是

两个字符,高字符用0填充，而且汉字'程'在ASCII下面是两个字节，而在UNICODE下仍旧是两个字节。UNICODE的

用处就是定长表示世界文字，据统计，用两个字节可以编码现存的所有文字而没有二义。

２. MBCS，它是多字节字符集，它是不定长表示世界文字的编码。MBCS表示英文字母时就和ASCII一样（这也是我们

容易把MBCS和ASCII搞混的原因），但表示其他文字时就需要用多字节。

WINDOWS下面的程序设计可以支持MBCS和UNICODE两种编码的字符串，具体用那种就看你定义了MBCS宏还是

UNICODE宏。MBCS宏对应的字符串指针是char*也就是LPSTR，UNICODE对应的指针是unsigned short*也就是

LPWSTR，为了写程序方便微软定义了类型LPTSTR，在MBCS下他就是char*, 在UNICODE下它是unsigned

char*,这样你就可以重定义一个宏进行不同字符集的转换了。

3. LPTSTR、LPCSTR、LPCTSTR、LPSTR的意义：

LPSTR：  32-bit指针指向一个字符串，每个字符占1字节
LPCSTR:  32-bit指针指向一个常字符串，每个字符占1字节
LPCTSTR: 32-bit指针指向一个常字符串,每字符可能占1字节或2字节，取决于Unicode是否定义
LPTSTR:  32-bit指针每字符可能占1字节或2字节，取决于Unicode是否定义

Windows使用两种字符集ANSI和UNICODE，前者就是通常使用的单字节方式，但这种方式处理象中文这样的双字节

字符不方便，容易出现半个汉字的情况。而后者是双字节方式，方便处理双字节字符。WindowsNT的所有与字符

有关的函数都提供两种方式的版本，而Windows9x只支持ANSI方式。_T一般同字常数相关，如_T("Hello"。如果

你编译一个程序为ANSI方式，_T实际不起任何作用。而如果编译一个程序为UNICODE方式，则编译器会把"Hello"

字符串以UNICODE方式保存。_T和_L的区别在于，_L不管你是以什么方式编译，一律以UNICODE方式保存.

４. 例1：

Windows核心编程的第一章。

L是表示字符串资源为Unicode的。

比如
wchar_t Str[] = L"Hello World!"; 这个就是双子节存储字符了。

_T是一个适配的宏～

当
#ifdef _UNICODE的时候
_T就是L
没有#ifdef _UNICODE的时候
_T就是ANSI的。

比如

LPTSTR lpStr = new TCHAR[32];
TCHAR* szBuf = _T("Hello");
以上两句使得无论是在UNICODE编译条件下都是正确编译的。

而且MS推荐你使用相匹配的字符串函数。
比如处理LPTSTR或者LPCTSTR 的时候，不要用strlen ,而是要用_tcslen

否则在UNICODE的编译条件下，strlen不能处理 wchar_t*的字符串。

T是非常有意思的一个符号（TCHAR、LPCTSTR、LPTSTR、_T()、_TEXT()...），它表示使用一种中间类型，既不

明确表示使用 MBCS，也不明确表示使用 UNICODE。那到底使用哪种字符集?编译的时候才决定

在大多数情况下，CString 转换成 LPTSTR是非常容易的，如果函数要求传入LPTSTR型的参数，直接传一个

CString也行，但是在visual studio 2008中，却偶尔会出现不能转换的情况，这个为什么呢？

有人以为这是ASCII（多字节）与Unicode（宽字节）之间的问题，其实不是，要知LPTSTR这个宏是随编译器参数

不同而不同的，如果在编译器——常规里面设置程序按ASCII编译，那LPTSTR就表示char*，如果选择按Unicode

编译那就是wchar_t*。CString也是如此，随编译器选项的不同，可以是ASCII字符串也可以是Unicode字符串。

那么CString与LPTSTR，要么全是多字节，要么全是宽字节，不可能存在两者之间不能转换的问题。

例2:

1. 如何将 CString 型转换为 LPBYTE
CString str;
LPBYTE by = (LPBYTE)(LPCSTR)str;

2. LPBYTE　如何转为CString 型

CString str;

str.Format("%s", by);

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

lwbeyond CSDN认证博客专家 CSDN认证企业博客

码龄19年

230: 原创

4万+: 周排名

207万+: 总排名

179万+: 访问

: 等级

1万+: 积分

1685: 粉丝

1559: 获赞

438: 评论

4899: 收藏

私信

关注

热门文章

分类专栏

Linux Shell 4篇
C/C++ 45篇
STL学习笔记 16篇
STL 17篇
Linux 41篇
vxWorsk 3篇
ACE 4篇
Eclipse 2篇
English 3篇
设计模式 24篇
网络编程 17篇
汽车电子 4篇
加密算法 1篇
正则表达式 2篇
读书与生活 9篇
嵌入式linux开发 18篇
QT 16篇
uC/OS-II 6篇
Java 6篇
Excel 11篇
Python 24篇
机器学习 6篇
Andriod 1篇

最新评论

Android Studio不支持AMD处理器 -- 解决方法
CSDN-Ada助手: 非常感谢您分享这篇有用的博客！对于像我这样使用AMD处理器的Android Studio用户来说，这些解决方法非常有用。我认为，下一篇博客可以探讨如何在Android Studio中使用NDK开发，这对于想要深入学习Android开发的读者来说非常有价值。相信您会有更多的读者受益。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
C++拷贝构造函数详解
塘鶴: 野指针问题吧，怕传的指针压根没有内容会出问题
C++拷贝构造函数详解
团子要当程序媛: 引用「if(p != NULL) { delete p; 」不太明白为何要判断if(p!=NULL)
C++拷贝构造函数详解
团子要当程序媛: 引用「p = new int; // 为新对象重新动态分配空间 *p = *(r.p)」能否合并成"p=new int(100);",会出问题吗？好像p=new int;*p=*(r.p);通用性更强
详解C语言中volatile关键字
YPSXYY: 二、volatile 的含义，这一节最后举的jiffies的例子我没看懂，mov jiffies,%eax不是将寄存器的值存到jiffies里面吗？然后寄存器++，然后将jiffies的值再搬回寄存器，三条命令下来jiffies和寄存器的值都没变吧？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。