php preg_replace空格无法替换问题

一次坑爹的小bug。读取一段文字(编码utf-8),想替换掉空格,str_replace(" "..)、preg_replace("/\s/"..)都不起作用。

 

1 <?php
2 
3 $str = '<p>    你好<p>';
4 $str = preg_replace('/\s/is','',$c);
5 $str = str_replace(" ", "a", $str); 
6 var_dump($str); //不起作用

 

没办法,将替换不了的空格ord()下才看到,这个utf-8空格比较特殊。ASCII 194 + 160出来的。

 

1 <?php
2 
3 $str = '<p>    你好<p>';
4 $str = str_replace(chr(194) . chr(160), "a", $str);  // 解决方法1
5 $str = preg_replace('/\xC2\xA0/is', "a", $str);  // 解决方法2
6 var_dump($str); //ok

 

 

问题的根源,在于UTF-8这种编码里面,存在一个特殊的字符,其编码是“0xC2 0xA0”(194 160),转换成字符的时候,表现为一个空格,跟一般的半角空格(ASCII 0x20)一样,唯一的不同是它的宽度不会被压缩,因此比较多的被用于网页排版(如首行缩进之类)。而其他的编码方式如GB2312、Unicode之类并没有这样的字符。

整理遇到的各种无法替换的字符:

chr(194).chr(160) 变现为空格

chr(227).chr(128) 变现为空格

chr(226).chr(128).chr(172).chr(226).chr(128).chr(172).chr(30) 变现为空

 

 

总结:替换不了的字符,打印出ASCII码来总能替换掉吧。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值