使用C++进行Unicode编程

最新推荐文章于 2024-07-27 17:05:52 发布

Mobidogs

最新推荐文章于 2024-07-27 17:05:52 发布

阅读量4.2k

点赞数

分类专栏： C/C++ COM/COM+ 文章标签：编程 c++ c 编译器 byte 工作

C/C++ 同时被 2 个专栏收录

116 篇文章 1 订阅

订阅专栏

COM/COM+

3 篇文章 0 订阅

订阅专栏

使用C++进行Unicode编程
对宽字符的支持其实是ANSI C标准的一部分，用以支持多字节表示一个字符。
宽字符和Unicode并不完全等同，Unicode只是宽字符的一种编码方式。

1、宽字符的定义

　　在ANSI中，一个字符（char）的长度为一个字节（Byte）。使用Unicode时，一个字符占据一个字，C++在wchar.h头文件中定义了最基本的宽字符类型wchar_t：

typedef unsigned short wchar_t;

从这里我们可以清楚地看到，所谓的宽字符就是无符号短整数。

2、常量宽字符串

　　对C++程序员而言，构造字符串常量是一项经常性的工作。那么，如何构造宽字符字符串常量呢？很简单，只要在字符串常量前加上一个大写的L就可以了，比如：

wchar_t *str1=L"Hello";

这个L非常重要，只有带上它，编译器才知道你要将字符串存成一个字符一个字。还要注意，在L和字符串之间不能有空格。

3、宽字符串库函数

为了操作宽字符串，C++专门定义了一套函数，比如求宽字符串长度的函数是

size_t __cdel wchlen(const wchar_t*);

　　为什么要专门定义这些函数呢？最根本的原因是，ANSI下的字符串都是以’/0’来标识字符串尾的（Unicode字符串以“/0/0”结束），许多字符串函数的正确操作均是以此为基础进行。而我们知道，在宽字符的情况下，一个字符在内存中要占据一个字的空间，这就会使操作ANSI字符的字符串函数无法正确操作。

以”Hello”字符串为例，在宽字符下，它的五个字符是：
0x0048 0x0065 0x006c 0x006c 0x006f
在内存中，实际的排列是：

48 00 65 00 6c 00 6c 00 6f 00

　　于是，ANSI字符串函数，如strlen，在碰到第一个48后的00时，就会认为字符串到尾了，用strlen对宽字符串求长度的结果就永远会是1！

4、用宏实现对ANSI和Unicode通用的编程

　　可见，C++有一整套的数据类型和函数实现Unicode编程，也就是说，您完全可以使用C++实现Unicode编程。
如果我们想要我们的程序有两个版本：ANSI版本和Unicode版本。当然，编写两套代码分别实现ANSI版本和Unicode版本完全是行得通的。但是，针对 ANSI字符和Unicode字符维护两套代码是非常麻烦的事情。为了减轻编程的负担，C++定义了一系列的宏，帮助您实现对ANSI和Unicode的通用编程。
　　C++宏实现ANSI和Unicode的通用编程的本质是根据”_UNICODE”（注意，有下划线）定义与否，这些宏展开为ANSI或Unicode字符（字符串）。

如下是tchar.h头文件中部分代码摘抄：

#ifdef  _UNICODE

typedef wchar_t     TCHAR;

#define __T(x)      L##x

#define _T(x)       __T(x)

#else

#define __T(x)      x

typedef char            TCHAR;

#endif

可见，这些宏根据”_UNICODE” 定义与否，分别展开为ANSI或Unicode字符。 tchar.h头文件中定义的宏可以分为两类：

A、实现字符和常量字符串定义的宏我们只列出两个最常用的宏：

宏未定义_UNICODE(ANSI字符) 定义了_UNICODE(Unicode字符) TCHAR char wchar_t _T(x) x L##x

注意：
　　“##”是ANSI C标准的预处理语法，它叫做“粘贴符号”，表示将前面的L添加到宏参数上。也就是说，如果我们写_T(“Hello”)，展开后即为L“Hello”

B、实现字符串函数调用的宏

C++为字符串函数也定义了一系列宏，同样，我们只例举几个常用的宏：

宏未定义_UNICODE(ANSI字符) 定义了_UNICODE(Unicode字符) _tcschr strchr wcschr _tcscmp strcmp wcscmp _tcslen strlen wcslen
<script type="text/javascript"> </script> <script src="http://pagead2.googlesyndication.com/pagead/show_ads.js" type="text/javascript"> </script>