之前做的一个csv格式文件导出功能,因为要把编码处理成gb2312格式,使用
mb_convert_encoding($str,'gb2312','utf-8')来处理,后来发现有几个字处理后是乱码,没错,就是 “珺” 这个字,网上看了很多,有说把gb2312改成gbk,还有用iconv来处理,试了半天,都不行,最后才找到解决方案,直接上代码吧
function convert_encoding($str, $encoding = 'gbk'){ $is_utf8 = preg_match('%^(?:[\x09\x0A\x0D\x20-\x7E]| [\xC2-\xDF][\x80-\xBF]| \xE0[\xA0-\xBF][\x80-\xBF] | [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2} | \xED[\x80-\x9F][\x80-\xBF] | \xF0[\x90-\xBF][\x80-\xBF]{2} | [\xF1-\xF3][\x80-\xBF]{3} | \xF4[\x80-\x8F][\x80-\xBF]{2} )*$%xs', $str); if($is_utf8 && $encoding == 'utf8'){ return $str; }elseif($is_utf8){ return mb_convert_encoding($str, $encoding, "UTF-8"); }else{ return mb_convert_encoding($str, $encoding, 'gbk,gb2312,big5'); } }
直接调用这个函数处理就行了,至于为什么,相信大家看了这个代码就明白了,废话就不说了。