Unicode与国际化软件开发学习心得

本文探讨了Unicode在Windows系统中的重要性,详细介绍了Unicode与ANSI的差异,以及如何在Windows API和VC++开发中进行转换。文章讨论了Windows的Unicode特性,系统代码页,以及在VC++6.0中开发Unicode程序的方法,强调了Unicode程序的双编译解决方案,包括TCHAR、宏定义、C运行时库函数和MFC类库的支持。此外,还提到了资源DLL在国际化软件开发中的作用。
摘要由CSDN通过智能技术生成

 “每一位软件开发人员必须、绝对要至少具备Unicode与字符集知识(没有任何例外!)”

Windows系统的Unicode特性
由于历史的原因,计算机系统中存在大量的ANSI特性,其使用的大多数文本文件,比如.txt,.ini,.cpp,.xml等等,大都是基于ANSI/DBCS编码的文件
但是,从Windows2K开始,从Windows系统的底层实现,已经全面基于Unicode,同时仍保证完全兼容ANSI/DBCS程序。虽然大多数应用程序仍是基于ANSI/DBCS,但是目前越来越多的程序支持,或者基于Unicode规范。
基于Unicode开发应用软件,开发效率更高,程序更通用,生成的数据也可以打破语言平台的限制。因此,我们认为,Unicode是Windows软件开发的大趋势。
Window NT 操作系统的基本文本表示是UTF-16,WCHAR是其基本数据类型。


Windows系统代码页
对于任何语言版本的Windows,系统都需要一个默认代码页,表示当前使用何种DBCS/扩展ASCII的文字编码。
西欧:  CP1252
简体中文系统: CP936
繁体中文系统: CP950
日文系统: CP932
韩文系统: CP949
当前系统代码页数值可以通过Windows API函数GetACP()得到。
该默认代码页可以手动修改。


修改Windows默认代码页
ANSI函数和Unicode函数
现有的Windows操作系统,包括98/2K/XP,其API接口中均存在两套函数,一套称为ANSI版本,支持ANSI/DBCS字符串,另一套称为Unicode版本,支持Unicode字符串。
例如,Kernel32.dll中,对于DeleteFile函数,使用Depends工具可以看出,实际上在接口中同时存在DeleteFileA和DeleteFileW两个函数,可供程序员调用。
这类对应的函数对,在功能方面完全相同,仅仅是输入字符串参数和返回值的类型定义不同,一为char*,一为WCHAR*。
针对ANSI字符串,Windows在其API中提供了很多辅助工具函数:
MultiByteToWideChar
WideCharToMultiByte
IsDBCSLeadByte(IsDBCSLeadByteEx)
CharNext(CharNextExA)
CharPrev(CharPrevExA)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值