今天用Perl解决了一个转码出现乱码的问题。需求是将gbk转换成big5.项目源码用的函数是decode()和encode()两个函数。源码如下:
#!/usr/bin/perl
use strict;
use warnings;
use Encode qw( encode decode );
my $gbk = '我是中国人,我爱中国,自古以来南海是中国不可分割的领土,小美国,日你妹,台湾当然也是中国的,我做的项目GBK转大五码就TM为你们做的';
my $def_code = decode('gbk',$gbk); #将gbk格式的汉字转换成utf8格式字符,且打开utf8_flag开关
my $big5 = encode('big5',$def_code); #将utf8格式的汉字转换成big5格式字符,且关闭utf8_flag开关
open F,">out.txt";
print F $big5;
print $big5;
输出结果(查看方式为big5编码方式)为:
从输出结果可以看出,这并不是我们想要的结果。
后来改用别的方式,代码如下:
#!/usr/bin/perl
use strict;
use warnings;
use Encode::HanConvert;
my $gbk = '我是中国人,我爱中国,自古以来南海是中国不可分割的领土,小美国,日你妹,台湾当然也是中国的,我做的项目GBK转大五码就TM为你们做的';
my $big5 = gb_to_big5($gbk);
use feature 'say';
open F,">out.txt";
print F $big5;
print $big5;
输出结果为:
注意两个代码的不同与导包的变化。
PS:该方法只适用于大部分的简体中文,对于gbk格式下的繁体字暂时不能解决!!! 若各位网友有好的解决办法或者有兴趣共同研究,欢迎留言,