使用Unicode应该遵循的一些基本原则:
- 将文本串视为字符数组,而不是chars数组或字节数组。
- 将通用数据类型(如TCHAR和PTSTR)用于文本字符和字符串。
- 将显式数据类型(如BYTE何PBYTE)用于字节、字节指针和数据缓存。
- 将TEXT宏用于原义字符和字符串。
- 执行全局性替换(例如用PTSTR替换PSTR)。
- 修改字符串运算问题。例如函数通常希望你在字符中传递一个缓存的大小,而不是字节。这意味着你不应该传递sizeof(szBuffer),而应该传递(sizeof(szBuffer)/sizeof(TCHAR)。另外,如果需要为字符串分配一个内存快,并且拥有该字符串中的字符数目,那么请记住要按字节来分配内存。也就是说,应该调用malloc(nCharacters*sizeof(TCHAR)),而不是调用malloc(nCharacters)。
标准C对Unicode的支持
typedef unsigned short wchar_t;
char *strcat(char*, const char*);
wchar_t *wcscat(wchar_t*, const wchar_t*);
int strcmp(const char*, const char*);
int wcscmp(const wchar_t*, const wchar_t*);
char* strcpy(char *, const char*);
wchar_t* wcscpy(wchar_t *, const wchar_t *);
size_t strlen(const char*);
size_t wcslen(const wchar_t*);
Windows中对Unicode字符串进行操作的函数
函数 | 描述 |
---|---|
lstrcat | 将一个字符串置于另一个字符串的结尾处 |
lstrcmp | 对两个字符串进行区分大小写的比较 |
lstrcmpi | 对两个字符串进行不区分大小写的比较 |
lstrcpy | 将一个字符串拷贝到内存中的另一个位置 |
lstrlen | 返回字符串的长度(按字符数来计量) |
Windows函数lstrcmp和lstrcmpi是作为对Windows函数CompareString的调用来实现的。
int CompareString(
LCID lcid,
DWORD fdwStyle,
PCWSTR pString1,
int cch1,
PCTSTR pString2,
int cch2);
该函数对两个Unicode字符串进行比较。CompareString的第一个参数用于设置语言ID(LCID),这是个32位值,用于标识一种特定的语言。CompareString使用这个LCID来比较这两个字符串,方法是对照一种特定的语言来查看它们的字符的含义。这种操作方法比C运行期函数简单地进行数值比较更有意义。
当lstrcmp函数系列中的任何一个函数调用CompareString时,该函数便将调用Windows的GetThreadString函数的结果作为第一个参数来传递:
LCID GetThreadLocale();
每次创建一个线程时,它就被赋予一种语言。函数将返回该线程的当前语言设置。