让我很头痛的Unicode
前阵子的项目中要求使用到Unicode编码,之前一直没有接触过,把我弄得晕头转向的。在网上找了些资料才对它有了一些了解,哎今天弄了《Windows核心编程》来看,居然发现这让我头痛的Unicode在这书的一开始就有了很详细了介绍。 真的是后悔以前没有多看几本书啊, 知识的积累阅读是一种很好的途径。
下面记录一些觉得挺有用的知识:[摘抄] Windows核心编程/第2章 U n i c o d e
2.9 成为符合ANSI和Unicode的应用程序
即使你不打算立即使用U n i c o d e ,最好也应该着手将你的应用程序转换成符合U n i c o d e 的应用程序。下面是应该遵循的一些基本原则:
• 将文本串视为字符数组,而不是c h a r s 数组或字节数组。
• 将通用数据类型(如T C H A R 和P T S T R )用于文本字符和字符串。
• 将显式数据类型(如B Y T E 和P B Y T E )用于字节、字节指针和数据缓存。
• 将T E X T 宏用于原义字符和字符串。
• 执行全局性替换(例如用P T S T R 替换P S T R )。
• 修改字符串运算问题。例如函数通常希望你在字符中传递一个缓存的大小,而不是字节。
这意味着你不应该传递s i z e o f ( s z B u ff e r ) ,而应该传递(s i z e o f ( s z B u ff e r ) / s i z e o f ( T C H A R )。另外,如果需要为字符串分配一个内存块,并且拥有该字符串中的字符数目,那么请记住要按字节来分配内存。这就是说,应该调用malloc(nCharacters *sizeof(TCHAR)),而不是调用m a l l o c( n C h a r a c t e r s )。在上面所说的所有原则中,这是最难记住的一条原则,如果操作错误,编译器将不发出任何警告。
当我为本书的第一版编写示例程序时,我编写的原始程序只能编译为A N S I 程序。后来,当我开始撰写本章的内容时,我想我应该鼓励使用U n i c o d e ,并且打算创建一些示例程序,以便展示你可以非常容易地编写既可以用U n i c o d e 也可以用A N S I 来编译的程序。这时我发现最好的办法是将本书的所有示例程序进行转换,使它们都能够用U n i c o d e 和A N S I 进行编译。