Windows上MBCS和UTF-8之间的区别

转:https://codeday.me/bug/20170816/56805.html

我在阅读Windows上的字符集和编码。我注意到有两个编译器标志在Visual Studio编译器(对于C)称为MBCS和UNICODE。它们之间有什么区别?我没有得到的是如何UTF-8在概念上不同于MBCS编码?另外,我在MSDN中发现了以下引用:

 

 

Unicode is a 16-bit character encoding

这否定了我读的关于Unicode的任何。我认为unicode可以编码与不同的编码,如UTF-8和UTF-16。有人能对这种混乱有更多的了解吗?

最佳答案

I noticed that there are two compiler
flags in Visual Studio compiler (for
C++) called MBCS and UNICODE. What is
the difference between them ?

Windows API中的许多函数有两个版本:一个采用char参数(在特定于语言环境的代码页中),另一个采用wchar_t参数(采用UTF-16)。

 

int MessageBoxA(HWND hWnd, const char* lpText, const char* lpCaption, unsigned int uType);
int MessageBoxW(HWND hWnd, const wchar_t* lpText, const wchar_t* lpCaption, unsigned int uType);

这些函数对中的每一个都有一个没有后缀的宏,这取决于是否定义了UNICODE宏。

 

#ifdef UNICODE
   #define MessageBox MessageBoxW
#else
   #define MessageBox MessageBoxA
#endif

为了使这项工作,TCHAR类型被定义为抽象出API函数使用的字符类型。

 

#ifdef UNICODE
    typedef wchar_t TCHAR;
#else
    typedef char TCHAR;
#endif

这个,但是,was a bad idea.你应该总是显式指定字符类型。

 

What I am not getting is how UTF-8 is
conceptually different from a MBCS
encoding ?

MBCS代表“多字节字符集”。对于字面意思来说,UTF-8似乎符合条件。

但在Windows中,“MBCS”仅指可与“A”版本的Windows API函数一起使用的字符编码。这包括代码页932(Shift_JIS),936(GBK),949(KS_C_5601-1987)和950(Big5),但不是UTF-8。

要使用UTF-8,你必须使用MultiByteToWideChar将字符串转换为UTF-16,调用函数的“W”版本,并在输出上调用WideCharToMultiByte。这本质上是“A”功能实际上做的,这让我想知道why Windows doesn’t just support UTF-8

这种无法支持the most common character encoding使得“A”版本的Windows API无用。因此,应始终使用“W”功能。

 

Unicode is a 16-bit character encoding

This negates whatever I read about the
Unicode.

MSDN是错误的。 Unicode是一个具有多种编码的21位编码字符集,最常见的是UTF-8,UTF-16和UTF-32。 (还有其他Unicode编码,例如GB18030,UTF-7和UTF-EBCDIC。)

每当Microsoft提到“Unicode”,他们真的意味着UTF-16(或UCS-2)。这是由于历史原因。 Windows NT是Unicode的早期采用者,回到16位被认为足以满足每个人,而UTF-8只用于计划9.所以UCS-2是Unicode。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值