让我很头痛的Unicode

最新推荐文章于 2024-10-13 18:33:13 发布

zifengqi123

最新推荐文章于 2024-10-13 18:33:13 发布

阅读量559

点赞数

分类专栏： MFC 文章标签： windows c 编程编译器

本文链接：https://blog.csdn.net/zifengqi123/article/details/5826231

版权

MFC 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

让我很头痛的Unicode

前阵子的项目中要求使用到Unicode编码，之前一直没有接触过，把我弄得晕头转向的。在网上找了些资料才对它有了一些了解，哎今天弄了《Windows核心编程》来看，居然发现这让我头痛的Unicode在这书的一开始就有了很详细了介绍。真的是后悔以前没有多看几本书啊，知识的积累阅读是一种很好的途径。

下面记录一些觉得挺有用的知识：[摘抄] Windows核心编程/第2章 U n i c o d e

2.9 成为符合ANSI和Unicode的应用程序

即使你不打算立即使用U n i c o d e ，最好也应该着手将你的应用程序转换成符合U n i c o d e 的应用程序。下面是应该遵循的一些基本原则：

• 将文本串视为字符数组，而不是c h a r s 数组或字节数组。
• 将通用数据类型（如T C H A R 和P T S T R ）用于文本字符和字符串。
• 将显式数据类型（如B Y T E 和P B Y T E ）用于字节、字节指针和数据缓存。
• 将T E X T 宏用于原义字符和字符串。
• 执行全局性替换（例如用P T S T R 替换P S T R ）。
• 修改字符串运算问题。例如函数通常希望你在字符中传递一个缓存的大小，而不是字节。

这意味着你不应该传递s i z e o f ( s z B u ff e r ) ,而应该传递（s i z e o f ( s z B u ff e r ) / s i z e o f ( T C H A R )。另外，如果需要为字符串分配一个内存块，并且拥有该字符串中的字符数目，那么请记住要按字节来分配内存。这就是说，应该调用malloc(nCharacters *sizeof(TCHAR)),而不是调用m a l l o c( n C h a r a c t e r s )。在上面所说的所有原则中，这是最难记住的一条原则，如果操作错误，编译器将不发出任何警告。

当我为本书的第一版编写示例程序时，我编写的原始程序只能编译为A N S I 程序。后来，当我开始撰写本章的内容时，我想我应该鼓励使用U n i c o d e ，并且打算创建一些示例程序，以便展示你可以非常容易地编写既可以用U n i c o d e 也可以用A N S I 来编译的程序。这时我发现最好的办法是将本书的所有示例程序进行转换，使它们都能够用U n i c o d e 和A N S I 进行编译。