C#和JAVA文件的UTF-8格式互换

web项目用JAVA写,安装程序用C#写成,安装时需要利用C#程序读取.java文件,该文件编码格式是UTF-8,一开始这样来读写JAVA文件的:
      using (StreamReader sr =
          new StreamReader(new FileStream(filePath, FileMode.Open),
          System.Text.Encoding.UTF8))
   {
    using (StreamWriter sw =
           new StreamWriter(new FileStream(newFile, FileMode.Create),
           System.Text.Encoding.UTF8))
    {
     string line = "";
     while ((line = sr.ReadLine()) != null)
     {
      for (int i = 0; i < args.Length; i++)
      {
       if (line.Contains(args[i]))
       {
        if (!line.Contains("=")) break;
        int offset = line.IndexOf('=');
        string replacedStr = line.Substring(offset + 1);
        line = line.Replace(replacedStr, " " + values[i] + ";");
       }
      }
      sw.WriteLine(line);
     }
    }
   }

结果发现生成的JAVA文件总是含有乱码,后来调研得知:

使用 Encoding.UTF8 是自动带 三 byte 的 BOM,如果要不添加 BOM。应该改用 UTF8Encoding utf8 = new UTF8Encoding(是否添加 BOM);

而JAVA文件的头中不包含这三个字节的BOM,因此C#源码改为如下一切恢复正常:

UTF8Encoding utf8 = new UTF8Encoding(false);

   using (StreamReader sr =
    new StreamReader(new FileStream(filePath, FileMode.Open),
    utf8))
   {
    using (StreamWriter sw =
     new StreamWriter(new FileStream(newFile, FileMode.Create),
     utf8))
    {
     string line = "";
     while ((line = sr.ReadLine()) != null)
     {
      for (int i = 0; i < args.Length; i++)
      {
       if (line.Contains(args[i]))
       {
        if (!line.Contains("=")) break;
        int offset = line.IndexOf('=');
        string replacedStr = line.Substring(offset + 1);
        line = line.Replace(replacedStr, " " + values[i] + ";");
       }
      }
      sw.WriteLine(line);
     }
     sr.Close();
     sw.Close();
    }
   }

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值