接收json格式错误，开头出现多余问号

最新推荐文章于 2023-04-04 16:05:38 发布

H-Sei

最新推荐文章于 2023-04-04 16:05:38 发布

阅读量7k

点赞数 2

本文链接：https://blog.csdn.net/armybase11/article/details/51130212

版权

php 同时被 3 个专栏收录

6 篇文章 0 订阅

订阅专栏

java

2 篇文章 0 订阅

订阅专栏

json

1 篇文章 0 订阅

订阅专栏

问题场景：

java后台调用php开发的服务接口返回json，数据toString后json数据开头出现多余问号；

    ?{"succ":true,"data":{"id":"31","keywords":"","description":""}};

问题原因：

返回的json字符串里含有bom头。

bom头是什么！

BOM: Byte Order Mark
就是一个字节顺序标签，类似一个标记，又叫签名，

BOM签名的意思就是告诉编辑器当前文件采用何种编码,方便编辑器识别,但是BOM虽然在编辑器中不显示,但是会产生输出,就像多了一个空行。
一般的编码集中并不会出现bom头，unicode编码集中会出现。
常见的bom头是：【摘录自：http://www.cnblogs.com/chengmo/archive/2010/10/30/1864004.html】

UTF-8 ║ EF BB BF
UTF-16LE ║ FF FE (小尾）
UTF-16BE ║ FE FF （大尾）
UTF-32LE ║ FF FE 00 00
UTF-32BE ║ 00 00 FE FF

为什么bom头会产生乱码？

有bom头的存储或者字节流，它一定是unicode字符集编码。到底属于那一种（utf-8还是utf-16或是utf-32)，通过头可以判断出来。

由于已经说过utf-16,utf-32不指定bom头，解析程序默认就认为是ansi编码，出现乱码。而utf-8指定或者不指定程序都可判断知道对于的字符集编码。

问题就出在这里，可能有的应用程序，它就认为如果utf-8编码，就不需要指定bom头，它可以自己判断，相反指定了bom头，它还会出现问题

（因为它把头当utf-8解析了）。如上面问题场景里的数据。

解决办法：

首先，对于本场景，java是没有根本解决办法的。（有些其他解决办法，毕竟治标不治本，大家可以自己去搜搜看看）这是oracle官网的原话（有点懒就不翻译了）

原文链接

总之意思就是java utf-8 暂不能处理bom头！

所以，想从根源上解决的话，还得去搞php;

php文件本身的存储方式为带BOM的UTF-8,普通页面的中文乱码方式一般不是由这个原因导致的。

header("Content-type: text/html; charset=utf-8");
这句话就可以控制html输出页面的编码方式了，

BOM只有在WINDOWS下采用“记事本”存储为UTF-8时才会有，所以根本原因就是这个，开发期间用记事本编辑过代码文件。

那么解决方法就有了，找到那个文件，找不到的排查所有代码文件，用notepad++或其他高级点的编辑器

存为utf-8编码，不带bom头的格式，然后应该就OK了