utf8 转 gbk/gb2312有些字乱码问题,例如 珺字

之前做的一个csv格式文件导出功能,因为要把编码处理成gb2312格式,使用

mb_convert_encoding($str,'gb2312','utf-8')来处理,后来发现有几个字处理后是乱码,没错,就是 “珺” 这个字,网上看了很多,有说把gb2312改成gbk,还有用iconv来处理,试了半天,都不行,最后才找到解决方案,直接上代码吧
function convert_encoding($str, $encoding = 'gbk'){
    $is_utf8 =  preg_match('%^(?:[\x09\x0A\x0D\x20-\x7E]| [\xC2-\xDF][\x80-\xBF]|  \xE0[\xA0-\xBF][\x80-\xBF] | [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2}    |  \xED[\x80-\x9F][\x80-\xBF] |  \xF0[\x90-\xBF][\x80-\xBF]{2}  | [\xF1-\xF3][\x80-\xBF]{3}  |  \xF4[\x80-\x8F][\x80-\xBF]{2} )*$%xs', $str);
    if($is_utf8 && $encoding == 'utf8'){
        return $str;
    }elseif($is_utf8){
        return mb_convert_encoding($str, $encoding, "UTF-8");
    }else{
        return mb_convert_encoding($str, $encoding, 'gbk,gb2312,big5');
    }
}

直接调用这个函数处理就行了,至于为什么,相信大家看了这个代码就明白了,废话就不说了。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值