ANSI和UNICODE：程序设置为MULTI-BYTE或Unicode的区别

最新推荐文章于 2021-02-08 16:15:24 发布

超频化石鱼

最新推荐文章于 2021-02-08 16:15:24 发布

阅读量1.2k

点赞数 5

分类专栏： VisualStudio 文章标签： VS 编码 ANSI Unicode

本文链接：https://blog.csdn.net/fyyyr/article/details/79228801

版权

VisualStudio 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

Windows使用两种字符集：ANSI和UNICODE。其中Unicode以16/32位表示一个字符，而ANSI以8位表示一个字符。

ANSI字符标准使用的是8位表示一个字符，所以ANSI用于表示字母和数字以及常用字符是没有问题的。但是无法表示汉字。

Unicode字符标准使用16/32位表示一个字符，所以Unicode可以用于表示汉字。

也就是说，Unicode比ANSI更宽，表示范围更大。

基于中国考虑，尽可能使用Unicode。

VS环境下可以设置字符为MULTI-BYTE或Unicode，默认为Unicode。

Multi-byte使用了ANSI字符集。Unicode使用了Unicode字符集。

因此，根据设置的不同，同一个函数会有两个版本，一个ANSI版，一个Unicode版。ANSI版叫A版，Unicode版更宽，所以叫W版。

NT内核里都是Unicode字串，基本上A版最终调用了W版，少数除外，特别是wininet里都是W的最后转成A的。也就是说，对于Windows编程而言，应尽可能使用Unicode。

有时候会遇到一些char与LPXXSTR之间的转换error。这是因为程序默认是使用Unicode。程序使用Unicode，其程序中的LPXXSTR就都会以Unicode来解释，Unicode是16/32位，所以LPXXSTR就是指向16/32位的数据。char是8位的，将char赋值给LPXXSTR，其位数不同，就会导致error。

如果将程序的字符集改为MULTI-BYTE，则可以解决该问题。但是不建议使用MULTI-BYTE。通常的一个解决方案是使用_T()。_T()是一个适配宏，若程序设置为MULTI-BYTE，则_T()不起作用；若程序设置为Unicode，则_T()会将内部的字符串从ANSI转换为Unicode。所以，Unicode程序最好使用_T()宏来转换。

再比如，在Unicode下MessageBox被编译为MessageBoxW，在MULTI-BYTE下被编译为MessageBoxA。

LPSTR LPCSTRLPWSTRLPCWSTR区别

LPSTR 一个32位的指向字符串的指针
LPCSTR 一个32位的指向字符串常量的指针
LPWSTR 一个32位的指向Unicode字符串的指针
LPCWSTR 一个32位的指向Unicode字符串常量的指针
前面的字母含义：

L代表LONG

P就是指针的意思,

C就是constant的意思
W是wide的意思，

STR就是string的意思

LPSTR = char *
LPCSTR = constchar *
LPWSTR =wchar_t *
LPCWSTR = constwchar_t *
LPOLESTR = OLECHAR* =BSTR = LPWSTR (Win32)
LPCOLESTR = const OLECHAR* =LPCWSTR (Win32)
LPTSTR =_TCHAR *
LPCTSTR = const_TCHAR *
即wchar指的是Unicode。

多字节字符串与宽字符串的转换可使用C API者Win32 API.
C API: mbstowcs,wcstombs
Win32 API: MultiByteToWideChar, WideCharToMultiByte

超频化石鱼

关注

5
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
ANSI和UNICODE：程序设置为MULTI-BYTE或Unicode的区别

Windows使用两种字符集：ANSI和UNICODE。其中Unicode以16/32位表示一个字符，而ANSI以8位表示一个字符。 ANSI字符标准使用的是8位表示一个字符，所以ANSI用于表示字母和数字以及常用字符是没有问题的。但是无法表示汉字。 Unicode字符标准使用16/32位表示一个字符，所以Unicode可以用于表示汉字。
复制链接

扫一扫

专栏目录