php批量移除UTF-8代码中的BOM

在保存一个以UTF-8编码的文件时,会在文件开始的地方插入三个不可见的字符(0xEF 0xBB 0xBF,即BOM)。它是一串隐藏的字符,用于让记事本等编辑器识别这个文件是否以UTF-8编码。对于一般的文件,这样并不会产生什么麻烦。但对于PHP文件来说,BOM的签名是个大麻烦。受COOKIE送出机制的限制,在这些文件开头已经有BOM的文件中,COOKIE无法送出(因为在COOKIE送出前PHP已经送出了文件头),所以登入和登出功能失效。一切依赖COOKIE、SESSION实现的功能全部无效。会造成使用PHP网页脚本,不能登入或者不能登出,页顶出现一条空白,页顶出现错误警告,其它不正常的情况。


一不小心让 ultraedit 写入了bom(因为我在别的机器上编辑过文件,他的ultraedit.ini没设置过),所以搞得authimage显示不出来,忙了好几天。当然最根本就是在ultraedit.ini中修改一下设置为:
程式碼:
Write UTF-8 BOM=0
Write UTF-8 BOM NF=0
同时写了一个小程序,用来自动移除文件头中的boms,放到根目录中执行一次就行了。 
程式碼:
<?php
if (isset($_GET['dir'])){ //config the basedir
$basedir=$_GET['dir'];
}else{
$basedir '.';


$auto 1

checkdir($basedir);

function 
checkdir($basedir){
if ($dh opendir($basedir)) {
while (($file readdir($dh)) !== false) {
if ($file != '.' && $file != '..'){
if (!is_dir($basedir."/".$file)) {
echo "filename: $basedir/$file ".checkBOM("$basedir/$file")." <br>";
}else{
$dirname $basedir."/".$file;
checkdir($dirname);
}
}
}
closedir($dh);
}
}

function 
checkBOM ($filename) {
global $auto;
$contents file_get_contents($filename);
$charset[1] = substr($contents01); 
$charset[2] = substr($contents11); 
$charset[3] = substr($contents21); 
if (ord($charset[1]) == 239 && ord($charset[2]) == 187 && ord($charset[3]) == 191) {
if ($auto == 1) {
$rest substr($contents3);
rewrite ($filename$rest);
return ("<font color=red>BOM found, automatically removed.</font>");
} else {
return ("<font color=red>BOM found.</font>");
}

else return ("BOM Not Found.");
}

function 
rewrite ($filename$data) {
$filenum fopen($filename"w");
flock($filenumLOCK_EX);
fwrite($filenum$data);
fclose($filenum);
}
?>
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值