Unicode是世界通用的字符编码标准,使用16位数据表示一个字符,一共可以表示65535种字符,可以包括现代计算机中使用的所有字符,包括各种字母、文字、在出版业中使用的特殊符号等。
传统的字符集,如Windows ASNI字符集,使用8位数据或将相邻的两个8位的数据组合在一起表示特殊的语言字符。Windows系统采用了ASNI自负的扩展方式,如果一个字节是负数,则在其后续的一个字节组合在一起表示一个字符。这种编码方式的字符集也称作“多字节”字符集。
Unicode与多字节编码演示
本例演示不同宽度的字符串的初始化,并将字符串输出进行比较。
新建win32空项目,添加代码如下:
#include <windows.h>
int WINAPI WinMain(
HINSTANCE hInstance,
HINSTANCE hPrevInstance,
LPSTR lpCmdLine,
int cCmdShow
)
{
//定义LPWSTR类型的宽字符串
LPWSTR szUnicode = L"This is a Unicode String";
//定义LPSTR类型的窄字符串
LPSTR szMultiByte = "This is not a Unicode String";
//定义LPTSTR类型的自适应字符串
LPTSTR szString = TEXT("This is Unicode or not depends on the option.");
//使用W版本的API函数,使用宽字符串为参数
MessageBoxW(NULL,szUnicode,L"<字符编码1>",MB_OK);
//使用A版本的API函数,使用窄字符串为参数
MessageBoxA(NULL,szMultiByte,"<字符编码2>",MB_OK);
//根据编译条件自动选择A版本或W版本的API函数,采用自适应的字符串类型为参数
MessageBox(NULL,szString,TEXT("<字符编码3>"),MB_OK);
return 0;
}
注:LPWSTR 为Unicode字符串变量类型;LPSTR为Windows(ASNI)字符串变量类型;LPTSTR 类型会根据环境配置,如果定义了UNICODE宏,则为LPWSTR 类型,否则为LPSTR类型