浅谈chr(239).chr(187).chr(191)的作用

最新推荐文章于 2022-02-04 13:04:52 发布

leoliyou

最新推荐文章于 2022-02-04 13:04:52 发布

阅读量1.3k

点赞数

分类专栏： PHP后端

PHP后端专栏收录该内容

22 篇文章 2 订阅

订阅专栏

json_decode(trim($param, chr(239) . chr(187) . chr(191)), true);

那么到底有什么用了，因此我在网上查阅了大量资料。

就是接口传回了json字符串数据，但是用json_decode()转码的时候发现，数据为NULL。

原因就是UTF-8的BOM头的影响.

BOM是什么

　　Unicode的学名是"Universal Multiple-Octet Coded Character Set"，简称为UCS。UCS可以看作是"Unicode Character Set"的缩写。在UCS 编码中有一个叫做 "Zero Width No-Break Space"，中文译名作“零宽无间断间隔”的字符，它的编码是 FEFF。而 FFFE 在 UCS 中是不存在的字符，所以不应该出现在实际传输中。UCS 规范建议我们在传输字节流前，先传输字符 "Zero Width No-Break Space"。这样如果接收者收到 FEFF，就表明这个字节流是 Big-Endian 的；如果收到FFFE，就表明这个字节流是 Little- Endian 的。因此字符 "Zero Width No-Break Space" （“零宽无间断间隔”）又被称作 BOM(即Byte Order Mark)。

UTF-8 BOM头又是什么

UTF-8以字节为编码单元因此不需要 BOM 来表明字节顺序，但可以用 BOM 来表明编码方式。字符 "Zero Width No-Break Space" 的 UTF-8 编码是 EF BB BF。所以如果接收者收到以 EF BB BF 开头的字节流，就知道这是 UTF-8编码了。

chr(239) . chr(187) . chr(191)拼接成utf-8 bom头，再使用trim函数即可

trim($param, chr(239) . chr(187) . chr(191))

去除utf-8 的bom头还有其他方法，以下是另一种方法:匹配是否存在bom头，存在则截掉前三位字符，即bom头

if(preg_match('/^\xEF\xBB\xBF/',$json_data)){
    $json_data = substr($info,3);
}
$json_data= json_decode(trim($json_data),true);

leoliyou

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录