PHP去除BOM头

转载 2017年01月03日 23:42:43

文章转自warman团队 小囧~ 原始链接https://www.oschina.net/code/snippet_162279_10073

今天客户两台服务器做了负载均衡之后,发现一个Ajax对两台服务器后台相同API调用返回了不同参数,查找了好久小囧帮我找到了问题所在,当我远程文件上传到服务器时产生了BOM头,导致返回的JSON产生了差异。(浏览器打印数据产生了小红点就是BOM头的原因)。服务器跑如下脚本之后可以清除带BOM头文件

BOM: Byte Order Mark 

UTF-8 BOM又叫UTF-8 签名,其实UTF-8 的BOM对UFT-8没有作用,是为了支援UTF-16,UTF-32才加上的BOM,BOM签名的意思就是告诉编辑器当前文件采用何种编码,方便编辑器识别,但是BOM虽然在编辑器中不显示,但是会产生输出,就像多了一个空行,


如果您在修改任何PHP文件後发生:

* 不能登入或者不能登出; * 页顶出现一条空白; * 页顶出现错误警告; * 其它不正常的情况。

则多半是编辑器的问题。

本程序采用UTF-8编码。现在几乎所有的文本编辑软件都可以显示并编辑UTF-8编码的文件。但是很遗憾,其中很多软件的表现并不理想。

类似WINDOWS自带的记事本等软件,在保存一个以UTF-8编码的文件时,会在文件开始的地方插入三个不可见的字符(0xEF 0xBB 0xBF,即BOM)。它是一串隐藏的字符,用于让记事本等编辑器识别这个文件是否以UTF-8编码。对于一般的文件,这样并不会产生什么麻烦。但对于 PHP来说,BOM是个大麻烦。

PHP并不会忽略BOM,所以在读取、包含或者引用这些文件时,会把BOM作为该文件开头正文的一部分。根据嵌入式语言的特点,这串字符将被直接执行(显示)出来。由此造成即使页面的 top padding 设置为0,也无法让整个网页紧贴浏览器顶部,因为在html一开头有这3个字符呢!

最大的麻烦还不是这个。受COOKIE送出机制的限制,在这些文件开头已经有BOM的文件中,COOKIE无法送出(因为在COOKIE送出前PHP已经送出了文件头),所以登入和登出功能失效。一切依赖COOKIE、SESSION实现的功能全部无效。

因此,在编辑、更改任何文本文件时,请务必使用不会乱加BOM的编辑器。Linux下的编辑器应该都没有这个问题。WINDOWS下,请勿使用记事本等编辑器。推荐的编辑器是: Editplus 2.12版本以上; EmEditor; UltraEdit(需要取消‘添加BOM’的相关选项); Dreamweaver(需要取消‘添加BOM’的相关选项) 等。

对于已经添加了BOM的文件,要取消的话,可以用以上编辑器另存一次。(Editplus需要先另存为gb,再另存为UTF-8。) ,以下是程序解决方案:

<?php
 
$auto= 1;
checkdir('C:\project\weibo');
functioncheckdir($basedir){
if($dh= opendir($basedir)) {
  while(($file= readdir($dh)) !== false) {
    if($file{0} == '.')
    {
        continue;
    }
   if($file!= '.'&& $file!= '..'){
    if(!is_dir($basedir."/".$file)) {
     echo"filename: $basedir/$file ".checkBOM("$basedir/$file")." <br>";
    }else{
 
     $dirname= $basedir."/".$file;
     checkdir($dirname);
    }
   }
  }
closedir($dh);
}
}
functioncheckBOM ($filename) {
global$auto;
$contents= file_get_contents($filename);
$charset[1] = substr($contents, 0, 1);
$charset[2] = substr($contents, 1, 1);
$charset[3] = substr($contents, 2, 1);
if(ord($charset[1]) == 239 && ord($charset[2]) == 187 && ord($charset[3]) == 191) {
  if($auto== 1) {
   $rest= substr($contents, 3);
   rewrite ($filename,$rest);
   return("<font color=red>BOM found, automatically removed.</font>");
  }else{
   return("<font color=red>BOM found.</font>");
  }
}
elsereturn ("BOM Not Found.");
}
functionrewrite ($filename,$data) {
$filenum= fopen($filename,"w");
flock($filenum, LOCK_EX);
fwrite($filenum,$data);
fclose($filenum);
}
?>

Delphi7高级应用开发随书源码

  • 2003年04月30日 00:00
  • 676KB
  • 下载

移除PHP中BOM的方法

好兄弟友情支持的虚拟主机最近老出问题,仔细询问了缘由,看来还是技术维护人员不到位造成,且服务器是Win2003+IIS,不稳定之余对PHP的支持也存在些微的问题. 不想去埋怨什么,期待早点完成维护即可...

【PHP】一个bom头引发的血案

事情的起源是一段很普通的代码: 没有问题,很简单的一段设置session的代码。 但是运行后却报错: Cannot send ses...
  • ohmygirl
  • ohmygirl
  • 2011年11月03日 14:05
  • 10843

PHP中出现BOM字符\ufeff,PHP去掉诡异的BOM \ufeff

研究一个PHP项目的时候,今天项目突然打不开了。  前几天还好好的,用Chrome看了下Response的内容,AJAX页面和普通HTML页面内容前面有一个红色的点。 鼠标移上去,提示“\ufeff”...

PHP检测并清除文件开头的BOM

网上看到的代码,收藏备份之,可以直接运行。

PHP返回JSON带BOM头的问题

今天遇到一个奇怪的问题,PHP服务器端返回的JSON文本,z

由于BOM头导致的Json解析出错

json数据时发现报        org.json.JSONException: Value  of type java.lang.String cannot be converted to JSO...

php和bom头的冤仇 和 如何在linux下使用命令去掉bom头

事情是这样的  我有个php文件的功能是读取一个二进制文件并且echo出来,该文件本来是图片文件,但是我访问这个php文件并且写入到本地硬盘的时候发现并不是图片格式  用hexdump 查看的时候发现...
  • sdcxyz
  • sdcxyz
  • 2015年09月11日 11:53
  • 2070

PHP去除BOM头

BOM: Byte Order Mark  UTF-8 BOM又叫UTF-8 签名,其实UTF-8 的BOM对UFT-8没有作用,是为了支援UTF-16,UTF-32才加上的BOM,BOM签名的意思...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:PHP去除BOM头
举报原因:
原因补充:

(最多只允许输入30个字)