删除uft-8文件bom头信息的方法

当我们保存一个以UTF-8编码的文件时,会在文件开始的地方插入三个不可见的字符(0xEF 0xBB 0xBF,即BOM),而(www.111cn.net)这个bom头可能导致一些不必要的问题,下面我整理了一些关于删除uft-8文件bom头信息一些常用方法,有兴趣的朋友可进入参考。from:http://www.111cn.net/wy/96/62144.htm

如果您在修改任何PHP文件发生:
 
* 不能登入或者不能登出; * 页顶出现一条空白; * 页顶出现错误警告; * 其它不正常的情况。
 
bom文件是怎么产生呢?
 
window编辑器如果保存为utf8文件就会帮你加上BOM头,以告诉其他编辑器以utf8来显示字符
 但是在网页上并不需要添加BOM头识别,因为网页上可以使用 head头 指定(www.111cn.net)charset=utf8告诉浏览器用utf8来解释.但是你用window自动的编辑器,编辑,然后有显示在网页上这样就会显示出0xEF 0xBB 0xBF这3个字符。
 这样网页上就需要去除0xEF 0xBB 0xBF,可以使用editplus 选择不带BOM的编码,这样就可以去除了
 
bom文件头信息删除
 
我最常用的方法来处理php文件处理

<?php
 /**
  * 用法:复制以下代码至新建的php文件中,将该php文件放置项目目录,运行即可。代码来源于网络。
  * chenwei 注。
  */
 header('content-Type: text/html; charset=utf-8');
 $auto=1;/* 设置为1标示检测BOM并去除,设置为0标示只进行BOM检测,不去除 */
 $basedir='.';
 $loop=true;
 echo '当前查找的目录为:'.$basedir.'当前的设置是:';
 echo '(1)',$loop?'检查当前目录以及当前目录的子目录':'只针对当前目录进行检测';
 echo '(2)',$auto?'检测文件BOM同时去除检测到BOM文件的BOM<br />':'只检测文件BOM不执行去除BOM操作<br />';
 
checkdir($basedir,$loop);
 function checkdir($basedir='',$loop=true){
     $basedir=empty($basedir)?'.':$basedir;
     if($dh=opendir($basedir)){
         while (($file=readdir($dh))!==false){
             if($file!='.'&&$file!='..'){
                 if(!is_dir($basedir.'/'.$file)){
                     echo '文件: '.$basedir.'/'.$file .checkBOM($basedir.'/'.$file).' <br>';
                 }else{
                     if(!$loop) continue;
                     $dirname=$basedir.'/'.$file;
                     checkdir($dirname);
                 }
             }
         }
         closedir($dh);
     }
 }
 function checkBOM($filename){
     global $auto;
     $contents=file_get_contents($filename);
     $charset[1]=substr($contents,0,1);
     $charset[2]=substr($contents,1,1);
     $charset[3]=substr($contents,2,1);
     if(ord($charset[1])==239&&ord($charset[2])==187&&ord($charset[3])==191){
         if($auto==1){
             $rest=substr($contents,3);
             rewrite($filename,$rest);
             return (' <font color=red>找到BOM并已自动去除</font>');
         }else{
             return (' <font color=red>找到BOM</font>');
         }
     }else{
         return (' 没有找到BOM');
     }
 }
 function rewrite($filename,$data){
     $filenum=fopen($filename,'w');
     flock($filenum,LOCK_EX);
     fwrite($filenum,$data);
     fclose($filenum);
 }
 


linux下查找包含BOM头的文件和清除BOM头命令


查找包含BOM头的文件,命令如下:
 
grep -r -I -l $'^\xEF\xBB\xBF' ./
 
这条命令会查找当前目录及子目录下所有包含BOM头的文件,并把文件名在屏幕上输出。
 
但是,删除BOM头,网上找到的命令大多不能用,比较常见的命令是:
 
grep -r -I -l $'^\xEF\xBB\xBF' /path(www.111cn.net) | xargs sed -i 's/^\xEF\xBB\xBF//;q'
 但这条命令会把除了首行之外所有的行删除,所以毫无意义。
 
经测试如下命令是可行的:
 
 find . -type f   -exec  sed -i 's/\xEF\xBB\xBF//' {} \;
 
这个命令会把当前目录及所有子目录下的BOM头删除掉。
from:http://www.111cn.net/wy/96/62144.htm

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值