Windows核心编程:第二章 字符和字符串处理
2.1 字符编码:
->在Windows Vista中每个Unicode字符都使用UTF-16编码,UTF-16将每个
字符编码为2个字节(16位)。
2.2 ANSI字符和Unicode字符与字符串数据类型
->char:表示一个8位ANSI字符
wchar_t:表示一个16位的Unicode(UTF-16)字符
eg: char c = 'A';
wchar_t = L'A'; // 大写字母L通知编译器该字符串应当编译为一
wchar_t szBuffer[100] = L"A String";// Unicode字符串。
->Windows定义的自己的数据类型(WinNT.h)
typedef char CHAR
typedef wchar_t WCHAR
----------------------
typedef CHAR *PCHAR;
typedef CHAR *PSTR;
typedef CONST CHAR *PCSTR;
typedef WCHAR *PWCHAR;
typedef WCHAR *PWSTR;
typedef CONST WCHAR *PCWSTR;
----------------------
#ifdef UNICODE
typedef WCHAR TCHAR,*PTCHAR,PTSTR;
typedef CONST WCHAR *PCTSTR;
#else
typedef CHAR TCHAR,*PTCHAR,PTSTR;
typedef CONST CHAR,*PCTSTR;
#endif
TCHAR c = _T('A');
TCHAR szBuffer[100] = _T("A String");
这样无论使用ANSI还是Unicode都可以编译通过。
2.3 Windows中的Unicode函数和ANSI函数
->自Windows NT起,所有函数都是用Unicode来构建,通用Unicode函数时
如果传入ANSI字符串,那么函数会把ANSI转化为Unicode,在传给系统,
如果函数希望返回ANSI字符串,操作系统会把Unicode字符串转化为ANSI,
再把结果传给应用程序。
->一个DLL如果想要导出ANSI和Unicode版本的函数,则可以在ANSI版本中
只分配内存,执行字符串的转换,然后调用该函数的Unicode版本。
2.4 C运行库的Unicode函数和ANSI函数
->C运行库提供的ANSI和Unicode函数都是自力更生,为了使源码既能ANSI
编译通过,又能Unicode编译通过,必须包含TChar.h文件,文件中定义了:
#ifdef _UNICODE
#define _tcslen wcslen
#else
#define _tcslen strlen
#endif
注意:在应用程序中要么同时定义UNICODE和_UNICODE,要么都不定义。
2.5 C运行库中的安全字符串函数
->在StrSafe.h文件中定义了新的安全字符串函数
可以使用_countof宏计算缓冲区大小
StringCchCat,StringCchCopy,StringCchPrintf,StringCchPrintfEx
//以上几个函数都可以实现截断字符串,Cch(Count of characters)
检测是否截断可以判断HRESULT返回值。
->Windows字符串函数
StrFormatKBSize,StrFormatByteSize,CompareString
2.6 推荐的字符和字符串处理方式
->将文本字符串想象为字符的数组,而不是char或字节的数组
->用通用数据类型(TCHAR/PTSTR)来表示文本和字符串
->用明确的数据类型(如BYTE和PBYTE)来表示字节,字节指针和数据缓冲区
->用_T宏表示字面量字符和字符串
->修改与字符串有关的计算如用_countof(szBuffer),而不是sizeof(szBuffer)
->避免使用printf。用MultiByteToWideChar和WideCharToMultiByte函数
进行Unicode和ANSI字符串的转换。
->UNICODE和_UNICODE要么同时指定,要么都不指定,UNICODE是用于
Windows函数的,_UNICODE是用于C运行库函数的。
2.1 字符编码:
->在Windows Vista中每个Unicode字符都使用UTF-16编码,UTF-16将每个
字符编码为2个字节(16位)。
2.2 ANSI字符和Unicode字符与字符串数据类型
->char:表示一个8位ANSI字符
wchar_t:表示一个16位的Unicode(UTF-16)字符
eg: char c = 'A';
wchar_t = L'A'; // 大写字母L通知编译器该字符串应当编译为一
wchar_t szBuffer[100] = L"A String";// Unicode字符串。
->Windows定义的自己的数据类型(WinNT.h)
typedef char CHAR
typedef wchar_t WCHAR
----------------------
typedef CHAR *PCHAR;
typedef CHAR *PSTR;
typedef CONST CHAR *PCSTR;
typedef WCHAR *PWCHAR;
typedef WCHAR *PWSTR;
typedef CONST WCHAR *PCWSTR;
----------------------
#ifdef UNICODE
typedef WCHAR TCHAR,*PTCHAR,PTSTR;
typedef CONST WCHAR *PCTSTR;
#else
typedef CHAR TCHAR,*PTCHAR,PTSTR;
typedef CONST CHAR,*PCTSTR;
#endif
TCHAR c = _T('A');
TCHAR szBuffer[100] = _T("A String");
这样无论使用ANSI还是Unicode都可以编译通过。
2.3 Windows中的Unicode函数和ANSI函数
->自Windows NT起,所有函数都是用Unicode来构建,通用Unicode函数时
如果传入ANSI字符串,那么函数会把ANSI转化为Unicode,在传给系统,
如果函数希望返回ANSI字符串,操作系统会把Unicode字符串转化为ANSI,
再把结果传给应用程序。
->一个DLL如果想要导出ANSI和Unicode版本的函数,则可以在ANSI版本中
只分配内存,执行字符串的转换,然后调用该函数的Unicode版本。
2.4 C运行库的Unicode函数和ANSI函数
->C运行库提供的ANSI和Unicode函数都是自力更生,为了使源码既能ANSI
编译通过,又能Unicode编译通过,必须包含TChar.h文件,文件中定义了:
#ifdef _UNICODE
#define _tcslen wcslen
#else
#define _tcslen strlen
#endif
注意:在应用程序中要么同时定义UNICODE和_UNICODE,要么都不定义。
2.5 C运行库中的安全字符串函数
->在StrSafe.h文件中定义了新的安全字符串函数
可以使用_countof宏计算缓冲区大小
StringCchCat,StringCchCopy,StringCchPrintf,StringCchPrintfEx
//以上几个函数都可以实现截断字符串,Cch(Count of characters)
检测是否截断可以判断HRESULT返回值。
->Windows字符串函数
StrFormatKBSize,StrFormatByteSize,CompareString
2.6 推荐的字符和字符串处理方式
->将文本字符串想象为字符的数组,而不是char或字节的数组
->用通用数据类型(TCHAR/PTSTR)来表示文本和字符串
->用明确的数据类型(如BYTE和PBYTE)来表示字节,字节指针和数据缓冲区
->用_T宏表示字面量字符和字符串
->修改与字符串有关的计算如用_countof(szBuffer),而不是sizeof(szBuffer)
->避免使用printf。用MultiByteToWideChar和WideCharToMultiByte函数
进行Unicode和ANSI字符串的转换。
->UNICODE和_UNICODE要么同时指定,要么都不指定,UNICODE是用于
Windows函数的,_UNICODE是用于C运行库函数的。