目录
PHP中使用数组转换成Json格式出现中文乱码解决方案
问题描述
- 请求接口返回值进行解析时出现
Malformed UTF-8 characters, possibly incorrectly encoded
的错误警告 - 在进行数组转换为JSON格式结果时,可能会出现中文字符乱码的情况。
解决方向
- 请求接口返回的数据包含特殊字符,需要进行编码转换,将最终的结果转换回
UTF-8
- 将数组中的每个元素进行URL格式编码,最后对结果JSON对象进行 URL解码1,以实现解决中文乱码问题。说到URL格式编码就不得不说到常见的 urlencode()2函数。
- PHP5.4版本,已经给Json新增了一个选项: JSON_UNESCAPED_UNICODE。加上这个选项后,就不会自动把中文编码了
URL编码原理
将需要转码的字符转为16进制,然后从右到左,取4位(不足4位直接处理),每2位做一位,前面加上%,编码成%XY格式。
例如:
汉字中对应的ASCII码是-10544,对应的16进制是D6D0,那么urlencode编码结果是:%D6%D0;
解决代码示例
一. 使用mb_convert_encoding()
函数
函数介绍:
php mb_convert_encoding,php内置编码转换方法。
方法原型:string mb_convert_encoding ( string $str , string $to_encoding [, mixed $from_encoding = mb_internal_encoding() ] )
将 string 类型 str 的字符编码从可选的 from_encoding 转换到 to_encoding。
mb_convert_encoding( $str, $encoding1, $encoding2)
- [函数参数 ]
- $str 转换编码的字符串
- $encoding1 目标编码,如utf-8,gbk,大小写均可
- $encoding2 原编码,如utf-8,gbk,大小写均可
- 中文乱码可以用以下方法转码
mb_convert_encoding($value, 'UTF-8', 'UTF-8');
- 将UTF-8,GBK,GB2312,BIG5这几种编码统一都转成UTF-8编码格式。
$content = mb_convert_encoding( $result, 'UTF-8', 'UTF-8,GBK,GB2312,BIG5' );
二. 数组遍历进行url解码
//遍历目标数组
foreach($array as $i=>$v){
// 需要对数组中每一个项进行URL编码
$array [$i]=urlencode($v);
}
//对最后的JSON对象进行URL解码,如果缺失这一步可能中文字段仍然为乱码情况
$JSON = urldecode(json_encode($array));
三. JSON_UNESCAPED_UNICODE 选项(推荐)
$json = json_encode($array,JSON_UNESCAPED_UNICODE);