跨平台UNICODE编程总结

这段时间在架构整个服务器,虽然前段时间受到了5.12汶川8.0级大地震的影响(深切悼念在此次大地震中遇难的同胞们),但是,我的工作还是在不断地向前推进着。为了让我们的服务器能够跨平台(主要是WINDOWS与LINUX),且能支持世界上的各种语言,我写了一个跨平台的且支持UNICODE的库。

其实,我在之前也有写过跨平台方面的代码,积累了不少的经验,但在写这个库的过程,还是遇到过许多问题,我觉得其中最值得注意的是在UNICODE的支持上,之前没有仔细去研究过LINUX的UNICODE编程,所以也并不知道LINUX下的UNICODE与WINDOWS下的UNICODE其实是不一样的。WINODWS下的UNICODE都是用两个字节,16位来表示的,也就是UCS2,而LINUX下的UNICODE是用四个字节,32位来表示的。这就导致了同样的代码,在WINDOWS与LINUX中会产生不同的结果。

例如,同样的代码:

wchar_t Str[] = L"测试";

wprintf(L"ls",Str);

在WINDOWS下能够编译通过,但是在LINUX下却很可能是不能编译通过的。这个主要是因为:

  1. WINDOWS下的UNICODE为UCS2,而LINUX下的UNICODE为UCS4。
  2. 代码文件的编码问题,WINDOWS下用VC保存的文件,都是WINDOWS.936编码的,VC也只能识别这种编码的带非英文字符的有效代码源文件;而LINUX下GCC需要的是与系统相关语言编码的源文件,如:如果LINUX下的语言是UTF8编码的,那么GCC就需要UTF8编码的带非英文字符的有效代码源文件,否则就会报错。

所以如果想要让编写的代码跨平台且支持UNICODE,那么就最好不要在有效代码中使用非英文字符,鉴于此,可以使用UNICODE文件来代替代码中的非英文字符。需要注意的是在读取文件后,需要根据不同的平台作平台相关的UNICODE编码转换,比如:WINDOWS就转换成UTF16(UCS2)的UNICODE,而LINUX就转换成UTF32(UCS4)的UNICODE。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值