本文基于笔者查阅的 perldoc 和试验结果。鉴于经常有人被编码问题困扰,现笔者把所了解的关于 Perl utf8 与编码处理的资料总结一下。由于所知有限,可能会有讲错的地方,如有需要,可自行查阅:
perldoc Encode
perldoc PerlIO
perldoc utf8
perldoc encoding
下面用到这几个函数,能提供有用的帮助:
Encode::is_utf8($str) # 当字符串 utf8 flag 为on时,返回真,否则返为假
utf8::is_utf8($str) # 同上
Encode::_utf8_on($str) # 手工设置 utf8 flag 为on
Encode::_utf8_off($str) # 手工设置 utf8 flag 为off
PerlIO::get_layers(FP) # 得到语柄的 layers
一. 基本概念
Perl 以 ascii 方式或者 utf8 方式解释字符串,取决 Perl 字符串内部的 utf8 flag ,utf8 flag 影响着 Perl 对字符的定义。以下代码演示 utf8 flag 的影响:
1. #!/bin/env perl
2.
3. # fileencoding: utf8
4. # termencoding: gbk
5.
6. use strict;
7. use warnings;
8. use Encode;
9. use Encode::CN;
10.
11. my $str = "中文字符串";
perldoc Encode
perldoc PerlIO
perldoc utf8
perldoc encoding
下面用到这几个函数,能提供有用的帮助:
Encode::is_utf8($str) # 当字符串 utf8 flag 为on时,返回真,否则返为假
utf8::is_utf8($str) # 同上
Encode::_utf8_on($str) # 手工设置 utf8 flag 为on
Encode::_utf8_off($str) # 手工设置 utf8 flag 为off
PerlIO::get_layers(FP) # 得到语柄的 layers
一. 基本概念
Perl 以 ascii 方式或者 utf8 方式解释字符串,取决 Perl 字符串内部的 utf8 flag ,utf8 flag 影响着 Perl 对字符的定义。以下代码演示 utf8 flag 的影响:
1. #!/bin/env perl
2.
3. # fileencoding: utf8
4. # termencoding: gbk
5.
6. use strict;
7. use warnings;
8. use Encode;
9. use Encode::CN;
10.
11. my $str = "中文字符串";