C# 获取文件编码格式

C# 获取文件编码格式

using System;
using System.Collections.Generic;
using System.IO;
using System.Text;

namespace Yadinghao.Framework.Utils
{
    public class FileEncoding
    {
        /// <summary> 
        /// 给定文件的路径,读取文件的二进制数据,判断文件的编码类型 
        /// </summary> 
        /// <param name=“FILE_NAME“>文件路径</param> 
        /// <returns>文件的编码类型</returns> 
        public static System.Text.Encoding GetType(string FILE_NAME)
        {
            FileStream fs = new FileStream(FILE_NAME, FileMode.Open, FileAccess.Read);
            Encoding r = GetType(fs);
            fs.Close();
            return r;
        }

        /// <summary> 
        /// 通过给定的文件流,判断文件的编码类型 
        /// </summary> 
        /// <param name=“fs“>文件流</param> 
        /// <returns>文件的编码类型</returns> 
        public static System.Text.Encoding GetType(FileStream fs)
        {
            byte[] Unicode = new byte[] { 0xFF, 0xFE, 0x41 };
            byte[] UnicodeBIG = new byte[] { 0xFE, 0xFF, 0x00 };
            byte[] UTF8 = new byte[] { 0xEF, 0xBB, 0xBF }; //带BOM 
            Encoding reVal = Encoding.Default;

            BinaryReader r = new BinaryReader(fs, System.Text.Encoding.Default);
            int i;
            int.TryParse(fs.Length.ToString(), out i);
            byte[] ss = r.ReadBytes(i);
            if (IsUTF8Bytes(ss) || (ss[0] == 0xEF && ss[1] == 0xBB && ss[2] == 0xBF))
            {
                reVal = Encoding.UTF8;
            }
            else if (ss[0] == 0xFE && ss[1] == 0xFF && ss[2] == 0x00)
            {
                reVal = Encoding.BigEndianUnicode;
            }
            else if (ss[0] == 0xFF && ss[1] == 0xFE && ss[2] == 0x41)
            {
                reVal = Encoding.Unicode;
            }
            r.Close();
            return reVal;

        }

        /// <summary> 
        /// 判断是否是不带 BOM 的 UTF8 格式 
        /// </summary> 
        /// <param name=“data“></param> 
        /// <returns></returns> 
        private static bool IsUTF8Bytes(byte[] data)
        {
            int charByteCounter = 1; //计算当前正分析的字符应还有的字节数 
            byte curByte; //当前分析的字节. 
            for (int i = 0; i < data.Length; i++)
            {
                curByte = data[i];
                if (charByteCounter == 1)
                {
                    if (curByte >= 0x80)
                    {
                        //判断当前 
                        while (((curByte <<= 1) & 0x80) != 0)
                        {
                            charByteCounter++;
                        }
                        //标记位首位若为非0 则至少以2个1开始 如:110XXXXX...........1111110X 
                        if (charByteCounter == 1 || charByteCounter > 6)
                        {
                            return false;
                        }
                    }
                }
                else
                {
                    //若是UTF-8 此时第一位必须为1 
                    if ((curByte & 0xC0) != 0x80)
                    {
                        return false;
                    }
                    charByteCounter--;
                }
            }
            if (charByteCounter > 1)
            {
                throw new Exception("非预期的byte格式");
            }
            return true;
        }


    }

}

使用方法

                        using (StreamReader sr = new StreamReader(file.FullName, FileEncoding.GetType(file.FullName)))
                        {
                            string sTemp = string.Empty;
                            string sCurEncode = sr.CurrentEncoding.EncodingName;
                            model.SITEMAP_ENCODING = sCurEncode;
                        }

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
C#中修改文件编码格式可以通过以下步骤实现: 1. 使用System.IO命名空间下的File类读取文件的内容。可以使用File.ReadAllText()或者File.ReadAllBytes()方法来读取文件的内容。 2. 通过判断文件内容的编码格式来确定当前文件编码格式。可以使用System.Text.Encoding类的GetEncoding()方法来判断文件编码格式。如果是Unicode编码,可以使用Encoding.Unicode属性来表示。 3. 如果需要修改文件编码格式为UTF-8,可以使用System.Text.Encoding类的GetBytes()方法将文件内容转换为字节数组,并指定目标编码格式为UTF-8。 4. 使用System.IO命名空间下的File类将修改后的字节数组写入文件中。可以使用File.WriteAllBytes()方法来写入字节数组到文件中。 下面是一个示例代码,演示如何在C#中修改文件编码格式为UTF-8: ``` using System.IO; using System.Text; public class FileEncodingConverter { public static void ConvertFileEncoding(string filePath) { // 读取文件内容 byte[] fileContent = File.ReadAllBytes(filePath); // 判断文件编码格式 Encoding fileEncoding = GetFileEncoding(fileContent); // 将文件内容转换为UTF-8编码 byte[] utf8Content = Encoding.Convert(fileEncoding, Encoding.UTF8, fileContent); // 将修改后的内容写入文件 File.WriteAllBytes(filePath, utf8Content); } private static Encoding GetFileEncoding(byte[] content) { // 判断文件编码格式 if (content.Length >= 3 && content == 0xEF && content == 0xBB && content == 0xBF) { // UTF-8 with BOM return Encoding.UTF8; } else if (content.Length >= 2 && content == 0xFF && content == 0xFE) { // UTF-16 Little Endian return Encoding.Unicode; } else if (content.Length >= 2 && content == 0xFE && content == 0xFF) { // UTF-16 Big Endian return Encoding.BigEndianUnicode; } else { // 默认使用系统当前编码 return Encoding.Default; } } } // 调用示例 string filePath = "path/to/your/file.txt"; FileEncodingConverter.ConvertFileEncoding(filePath); ``` 以上代码会将指定文件编码格式修改为UTF-8,并保存修改后的内容。请确保在使用该代码时传入正确的文件路径。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [C#批量替换文档的编码格式](https://download.csdn.net/download/oshizu/5763281)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* *3* [C# 确定文件编码格式的方法](https://blog.csdn.net/lihongmao5911/article/details/128880240)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

亚丁号

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值