PHP中字符串编码的一些问题(Malformed UTF-8 characters, possibly incorrectly encoded)

问题:php报错Malformed UTF-8 characters, possibly incorrectly encoded

原因:有可能是数据库中部分字段编码有问题

// 先将数据库数据转成GBK,再转成UTF-8
$friend['name']=iconv("utf-8","gbk//IGNORE",$friend['name']);
$friend['name'] = mb_convert_encoding($friend['name'],'UTF-8','GBK');

字符串编码方法

// 获取当前字符串编码
$encode = mb_detect_encoding($str, array("ASCII",'UTF-8',"GB2312","GBK",'BIG5')); 

// 将gbk换为utf-8,使用mb_convert_encoding的方式
$str_encode = mb_convert_encoding($str, 'UTF-8', 'GBK');
// 把gbk置换成utf-8,使用iconv的方式
$str_encode=iconv("UTF-8","GBK",$str);

// mb_convert_encoding和iconv的区别
// 1、mb_convert_encoding() 该函数会根据内容自动识别编码,但是执行效率比iconv差;
// 2、然后有一种说法就是iconv()在一些字符转换下会不正常,网上有种说法就是:发现iconv在转换字符”—”到gb2312时会出错,如果没有 ignore参数,所有该字符后面的字符串都无法被保存。不管怎么样,这个”—”都无法转换成功,无法输出。 另外 mb_convert_encoding没有这个bug.
// 3、mb_convert_encoding()是PHP扩展函数,要开启扩展库才能用;而iconv是PHP内置函数,不需另外开启扩展库就可以使用。
// 4、一般情况下用 iconv,只有当遇到无法确定原编码是何种编码,或者iconv转化后无法正常显示时才用mb_convert_encoding 函数.

如果一个字符串输出出来是utf-8,但是使用json_encode()报编码错误的话,可以尝试将他转换为其他编码再转换回来

$newStr = mb_convert_encoding($str, 'GBK', 'UTF-8');
$str = mb_convert_encoding($newStr, 'UTF-8', 'GBK');

将数组中的元素进行转码

//更改编码为utf8
protected function array2utf8($array){
    $array = array_map(function($value){
        if(is_array($value)){
            return $this->array2utf8($value);
        }else{
            return mb_convert_encoding($value, "UTF-8", "GB2312");
        }
    }, $array);
    return $array;
}  
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值