日本字全角字符linux,将全角字符转换为半角字符(perl,regex,日语)

我有一个将全角字符转换为半角字符的程序。除数字零外,它工作正常。全角零不会转换为半角零。

Perl

use strict;

use warnings;

use warnings qw(FATAL utf8);

use utf8;

use feature qw(unicode_strings);

use open qw(:std :utf8);

unless ( @ARGV == 2 ) {

print "Usage: script.pl input_file output_file\n";

exit;

}

my %fwhw = (

'0' => '0', '1' => '1', '2' => '2', '3' => '3', '4' => '4',

'5' => '5', '6' => '6', '7' => '7', '8' => '8', '9' => '9',

'A' => 'A', 'B' => 'B', 'C' => 'C', 'D' => 'D', 'E' => 'E',

'F' => 'F', 'G' => 'G', 'H' => 'H', 'I' => 'I', 'J' => 'J',

'K' => 'K', 'L' => 'L', 'M' => 'M', 'N' => 'N', 'O' => 'O',

'P' => 'P', 'Q' => 'Q', 'R' => 'R', 'S' => 'S', 'T' => 'T',

'U' => 'U', 'V' => 'V', 'W' => 'W', 'X' => 'X', 'Y' => 'Y',

'Z' => 'Z', 'a' => 'a', 'b' => 'b', 'c' => 'c', 'd' => 'd',

'e' => 'e', 'f' => 'f', 'g' => 'g', 'h' => 'h', 'i' => 'i',

'j' => 'j', 'k' => 'k', 'l' => 'l', 'm' => 'm', 'n' => 'n',

'o' => 'o', 'p' => 'p', 'q' => 'q', 'r' => 'r', 's' => 's',

't' => 't', 'u' => 'u', 'v' => 'v', 'w' => 'w', 'x' => 'x',

'y' => 'y', 'z' => 'z', '-' => '-', '、' => ', ', ' ' => ' ',

'/' => '/',);

sub slurp {

my $file = shift;

open my $fh_read, '

return do {local $/; };

}

sub convert {

my $sub_string = shift;

$sub_string =~ s/(.)/$fwhw{$1}?$fwhw{$1}:$1/seg;

return $sub_string;

}

my $string = slurp($ARGV[0]);

$string =~ s/\s*\K(.*?)(?=\s*)/convert($1)/seg;

open my $fh_write, ">", $ARGV[1] or die "Could not open file: $!";

print $fh_write $string;

close $fh_write;

这是我尝试过的

我通过检查代码点确保数字0(零)和字母O(哦)确实不同。全角0为\ x {ff10}。全角字母O为\ x {ff2f}。我使用以下代码对此进行了检查:

use Encode;

sub codepoint_hex {

sprintf "%04x", ord Encode::decode("UTF-8", shift);

}

my $codepoint = codepoint_hex('0');

print $codepoint, "\n";

我检查了哈希表是否正确加载了所有键和值。

我还没有尝试过的东西:

我还没有尝试在Linux上重复这种奇怪的事情。我在Windows 10上使用ActiveState Perl 5.24。

如果任何人有任何建议或看到我的错误,我将非常感谢您的指导。感谢您抽出宝贵的时间阅读并考虑我的帖子。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值