php制定字符编码类型,php字符编码转换问题

环境要求:网站有中文,韩文,实现编码转换。

在php中解决字符编码转换,有两种办法:

使用php函数进行字符编码解码,但是对性能有一定影响,并且要针对每种字符编码编写专用的函数。

另外一种就是php手册中的专门函数,比如iconv函数、mb_convert_encoding函数实现编码转换。

在php中编码转换函数有两种:

1,使用iconv函数转换字符编码,该函数仅能在PHP4.0.5以上版本或PHP5.x版本使用,具体用法:

$string=iconv(原字符编码, 字符输出编码, $string);

例如:网页使用gbk编码,字符串使用utf-8编码,将字符转换为网页显示编码。

echo iconv("uft-8", "gbk", "php编码转换");

在实际使用中,iconv函数在转换时存在一点小bug,在转换字符串中含有"—"时会出错,导致字符串无法转换,使用//IGNORE参数可以忽略转换中的字符错误。

例子:

echo iconv("uft-8", "gbk//IGNORE", "php编码转换");

2,使用mb_convert_encoding函数,该函数仅能在PHP4.0.6以上版本或PHP5.x版本使用,使用之前必须enable mbstring。

例子:

复制代码 代码示例:

$string=mb_convert_encoding($string, 字符输出编码, 原字符编码);

例如:网页使用gbk编码,字符串使用utf-8编码,将字符转换为网页显示编码。

复制代码 代码示例:

echo mb_convert_encoding("php编码转换", "gbk", "utf-8");

总结:推荐使用mb_convert_encoding函数,该函数无iconv转换字符错误问题。

对字符串进行编码转换,要转成UTF-8。

如果知道原字符串编码,就可以使用大家都熟悉的iconv函数,但现在是不知道原字符串的编码,可能是GBK,也可能原来就是UTF-8,就不能使用这个方法了。

如果可以获取字符串编码类型,或者有一个自动识别原字符串编码的编码转换函数就好了。

结果找到了mb_convert_encoding函数就是那个可以自动识别原字符串编码的函数,但在使用中,发现GBK中的某些汉字被它转成了乱码。

后来又在php手册上找到了is_utf8函数,然后结合iconv函数,问题得以解决。

用到的编码转换函数:

复制代码 代码示例:

function is_utf8($string) {

return preg_match(’%^(?:

[\x09\x0A\x0D\x20-\x7E]            # ASCII

| [\xC2-\xDF][\x80-\xBF]            # non-overlong 2-byte

| \xE0[\xA0-\xBF][\x80-\xBF]        # excluding overlongs

| [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2} # straight 3-byte

| \xED[\x80-\x9F][\x80-\xBF]        # excluding surrogates

| \xF0[\x90-\xBF][\x80-\xBF]{2}    # planes 1-3

| [\xF1-\xF3][\x80-\xBF]{3}          # planes 4-15

| \xF4[\x80-\x8F][\x80-\xBF]{2}    # plane 16

)*$%xs’, $string);

} // function is_utf8

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值