C#判断txt文档codepage

基于.netframework4.0的程序,代码如下:

  public int GetTxtCodePage(FileStream filestream)
        {
            BinaryReader br = new BinaryReader(filestream);
            Byte[] buffer = new Byte[3];
            int count = br.Read(buffer, 0, 3);
            if (buffer[0] >= 0xEF)
            {
                if (buffer[0] == 0xEF && buffer[1] == 0xBB && buffer[2] == 0xBF)
                {
                    return 65001;  //UTF8
                }
                else if (buffer[0] == 0xFE && buffer[1] == 0xFF)
                {
                    return 1201;   //UTF-16 Big endian
                }
                else if (buffer[0] == 0xFF && buffer[1] == 0xFE)
                {
                    return 1200;   //UTF-16 Little endian(unicode)
                }
                else
                {
                    return 936;   //GBK
                }
            }
            else return 936;  //GBK
        }

测试有些txt文件由于编码不规范,导致了打开乱码。

如有错误,请广大码友指正~~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值