php 非法utf8字符串,escape utf8字符串的php实现

网上很多javascript escape的php实现,都是针对gb2312的,主要缺点就是gb之外的字符不能正确escape。并且函数中字符的分界也有问题。所以对其进行了更新。

用了一晚上时间,仔细学习了一下字符编码的知识,将escape函数改为utf8版本,这样,就可以正确的编码所有的文字了。

目前写了两个版本:function escape($str) {

preg_match_all("/[\xc2-\xdf][\x80-\xbf]+|[\xe0-\xef][\x80-\xbf]{2}|[\xf0-\xff][\x80-\xbf]{3}|[\x01-\x7f]+/e",$str,$r);

//匹配utf-8字符,

$str = $r[0];

$l = count($str);

for($i=0; $i

$value = ord($str[$i][0]);

/*

if($value >= 192 && $value <= 223) $i++;//单字节

elseif($value >= 224 && $value <= 239) $i = $i + 2;//双字节

elseif($value >= 240 && $value <= 247) $i = $i + 3;//三字节

*/

if($value < 223){

$str[$i] = rawurlencode(utf8_decode($str[$i]));

//先将utf8编码转换为ISO-8859-1编码的单字节字符,urlencode单字节字符.

//utf8_decode()的作用相当于iconv("UTF-8","CP1252",$v)。

}else{

$str[$i] = "%u".strtoupper(bin2hex(iconv("UTF-8","UCS-2",$str[$i])));

}

}

return join("",$str);

}

这个版本使用循环,逐字escape。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值