去掉Bom头的方法和为什么要清除Bom头

什么是bom头?

在utf-8编码文件中BOM在文件头部,占用三个字节,用来标示该文件属于utf-8编码,现在已经有很多软件识别bom头,但是还有些不能识别bom头,比如PHP就不能识别bom头,这也是用记事本编辑utf-8编码后执行就会出错的原因了。

去掉bom头的办法,简单的是下面两种:

1、editplus去BOM头的方法

 
编辑器调整为UTF8编码格式后,保存的文件前面会多出一串隐藏的字符(也即是BOM),用于编辑器识别这个文件是否是以UTF8编码。
 
运行Editplus,点击工具,选择首选项,选中文件,UTF-8标识选择 总是删除签名,
 

然后对PHP文件编辑和保存后的PHP文件就是不带BOM的了。
 

2、ultraedit去除bom头办法

打开文件后,另存为选项的编码格式里选择(utf-8 无bom头),确定就ok了

怎么样,去掉bom头很简单吧


再来一段议论utf8的BOM信息的

BOM是指php文件本身的存储方式为带BOM的UTF-8,普通页面的中文乱码方式一般不是由这个原因导致的。

header("Content-type: text/html; charset=utf-8");
这句话控制html输出页面的编码方式,

BOM只有在WINDOWS下采用“记事本”存储为UTF-8时才会有,这个可以用WINHEX把开始的2个字节删掉。
在dreamweaver里面编码设置里面可以设置是否带BOM,一般只要php输出的不是图片(GDI Stream),BOM都不会导致问题。

GDI Stream如果开头有了额外的 字符就会显示为 红叉。


以下是清除Bom的PHP文件代码(放置网站更目录即可):

cleanBom.php

<?php
if (isset($_GET['dir'])) { //设置文件目录 
    $basedir = $_GET['dir'];
} else {
    $basedir = '.';
}

$auto = 1;
checkdir($basedir);

function checkdir($basedir)
{
    if ($dh = opendir($basedir)) {
        while (($file = readdir($dh)) !== false) {
            if ($file != '.' && $file != '..') {
                if (!is_dir($basedir . "/" . $file)) {
                    echo "filename: $basedir/$file " . checkBOM("$basedir/$file") . " <br>";
                } else {
                    $dirname = $basedir . "/" . $file;
                    checkdir($dirname);
                }
            }
        }
        closedir($dh);
    }
}
function checkBOM($filename)
{
    global $auto;
    $contents   = file_get_contents($filename);
    $charset[1] = substr($contents, 0, 1);
    $charset[2] = substr($contents, 1, 1);
    $charset[3] = substr($contents, 2, 1);
    if (ord($charset[1]) == 239 && ord($charset[2]) == 187 && ord($charset[3]) == 191) {
        if ($auto == 1) {
            $rest = substr($contents, 3);
            rewrite($filename, $rest);
            return ("<font color='red'>BOM found, automatically removed.</font>");
        } else {
            return ("<font color='red'>BOM found.</font>");
        }
    } else
        return ("BOM Not Found.");
}

function rewrite($filename, $data)
{
    $filenum = fopen($filename, "w");
    flock($filenum, LOCK_EX);
    fwrite($filenum, $data);
    fclose($filenum);
}
?>



  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
在 Java 中,我们可以使用 `java.nio.charset.CharsetDecoder` 类来处理 UTF-16 编码的 BOM 。 下面是一个例子: ```java import java.io.*; import java.nio.charset.Charset; import java.nio.charset.CharsetDecoder; import java.nio.charset.CodingErrorAction; public class RemoveBOM { public static void main(String[] args) throws IOException { // 打开 UTF-16 编码的文件 FileInputStream fis = new FileInputStream("file.txt"); InputStreamReader isr = new InputStreamReader(fis, Charset.forName("UTF-16")); // 创建 CharsetDecoder 对象 CharsetDecoder decoder = Charset.forName("UTF-16").newDecoder(); decoder.onMalformedInput(CodingErrorAction.IGNORE); decoder.onUnmappableCharacter(CodingErrorAction.IGNORE); // 读取文件内容 CharBuffer cb = CharBuffer.allocate(fis.available()); isr.read(cb); cb.flip(); // 去除 BOM if (cb.length() > 0 && cb.charAt(0) == '\ufeff') { cb.deleteCharAt(0); } // 处理文件内容 // ... // 保存文件内容 FileOutputStream fos = new FileOutputStream("file.txt"); OutputStreamWriter osw = new OutputStreamWriter(fos, Charset.forName("UTF-16")); osw.write(cb.toString()); osw.close(); } } ``` 在这个例子中,我们首先使用 `java.io.FileInputStream` 和 `java.io.InputStreamReader` 打开了一个 UTF-16 编码的文件,并通过 `java.nio.charset.Charset.forName` 方法创建了一个 `java.nio.charset.CharsetDecoder` 对象。 然后,我们使用 `java.nio.charset.CharsetDecoder` 对象读取了文件内容,并检查了它是否以 BOM 。如果是,我们使用 `java.lang.CharSequence.deleteCharAt` 方法从内容中去除了 BOM 。 在处理完文件内容后,我们再次使用 `java.io.FileOutputStream` 和 `java.io.OutputStreamWriter` 将内容写入文件中。这次,由于我们已经去除了 BOM ,所以写入的文件是没有 BOM 的。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

汀风说后端

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值