C#怎么判断一个文件的编码格式是UTF-8 without BOM的啊


文本文件的开头头三个字节存放编码格式,这三个字节就叫做 BOM。

当头部开始的两个字节为 0xff 0xfe 0x41 时,是Unicode的小尾编码;
当头部的两个字节为        0xfe 0xff 0x00 时,是Unicode的大尾编码;
当头部两个字节为            0xef 0xbb 0xbf 时,是Unicode的UTF-8编码;
当它不为这些时,则是ANSI编码。

判断是ANSI还是无BOM的UTF-8还得多一步,


http://blog.csdn.net/ybhjx/article/details/52205831

C#写文件时指定是否有BOM:
1)下面的代码是UTF-8 without BOM:

var utf8WithoutBom = new System.Text.UTF8Encoding(false);
using (var sink = new StreamWriter("Foobar.txt", false, utf8WithoutBom))
{
sink.WriteLine("...");
}

2)下面是C#在写文件时指定BOM头的代码:
var utf8WithBom = new System.Text.UTF8Encoding(true);  // 用true来指定包含bom

StreamWriter swr = null;
try
{
    swr = new StreamWriter("okbase.txt", false, utf8WithBom);
    swr.Write("hello okbase.net!");
}
catch(Exception e)
{
}
finally
{
    if (swr != null)
    {
        swr.Close();
        swr.Dispose();
    }
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值