1、 字符和字符串处理是很多软件的头痛之处,其实就是本地化自己的应用程序,这里有很多历史遗留问题。
2、 Windows其实早就开始呼吁大家使用Unicode字符集进行编程,因为缓冲区溢出错误已经成为各种应用程序bug或者操作系统安全攻击的源头和媒介,而这大多是使用ANSI字符串及其api函数导致。关于各种字符集的区别和应用这里就不细说了,网上有很多详细的介绍。
3、 自Windows NT起,Windows的所有版本都完全用Unicode创建,也就是说,所有核心函数都需要Unicode字符串,调用Windows函数时,如果参数列表有字符串,则该函数通常有两个版本,一个接受Unicode字符串,一个接受ANSI字符串,而ANSI版本其实就是先将ANSI装换成Unicode然后再调用Unicode版本。例如CreateWindowsEx,CreateWindowsExW接受Unicode字符串,CreateWindowsExA接受ANSI字符串。但在平时,我们只是在代码中调用CreateWindowsEx,而由项目自己选择调用哪个版本, 这些是由宏定义决定的。例如
#ifdef UNICODE
#define MessageBox MessageBoxW
#else
#define MessageBox MessageBoxA
#endif
其实底层来讲,ANSI版本就是一个转换层负责分配内存,以便将ANSI字符串转换成Unicode字符串,返回时再释放缓冲区,所以调用ANSI一般会需要更多内存,运行较慢,而且容易出现bug,建议一直使用Unicode开发。
4、 Windows将一些C运行库中的修改字符串且在安全隐患Unicode的函数和ANSI函数摒弃,鼓励大家是Windows定义的安全的字符串处理函数,与原来函数相比,加了_s的后缀,如_tcscpy_s,_tcscat_s等,如何使用这里就不过多介绍了。Windows还为我们提供了自己的一些更方便的字符串处理函数,是C运行库没有的。如比较字符串comapreString等。
5、 使用Unicode的原因:1、有利于应用本地化。2、只需要发布一个二进制文件即可支持所有语言。3、提升应用程序效率。4、一些Windows函数目前只提供Unicode版本。5、应用代码很容易与COM、.NET Framework集成。6、能够保证应用程序代码轻松操作资源。
6、 Unicode和ANSI转换,调用MultiByteToWideChar和WideCharToMultiByte进行转换。判断字符串是Unicode还是ANSI字符集可以使用函数IsTextUnicode。如何使用不介绍。
7、 大致就是这些主要内容啦。