这两天在写代码生成工具,然而在生成solution文件(xxx.sln)后,其文件显示图标竟然既不是VS2008的小图标,也不是VS2010小图标;显示的是这样的一个图标;先说明一下我机器装了VS2008和2010;而且双击也没反应。真是挺奇怪的。 而程序目标是生成VS2008那样的方案。
于是我用VS2008建了一个解决方案,用EditPlus打开与生成的文件比较一下;竟然在生成的方案文件头部多了个未知字符。根据你生成的编码方式不同,多的那个未知字符也不同。好奇心越来越浓。手动删掉多余字符,看一下图标还是没变成正常。为什么呢?难道是文件编码问题,于是在EditPlus另存为时看了一下编码,两文件果然不一样;正确文件的编码是UTF-8 + BOM;而生成的却不是这个编码。另存一下正确编码,图标果然正确显示了;双击也可以打开了。
1、开始为什么出现编码及多余字符问题呢?
开始代码是这样的:
var xmlSolution = System.Text.Encoding.Default.GetString(XPNetTool.CodeGenerator.Global.AppResource.XPNet_Solution2008);
写出时是这样的:
StreamWriter sw = new StreamWriter(Filename, false, Encoding.Default);
sw.Write(xmlSolution);
sw.Flush();
sw.Close();
2、怎样才能避免这种编码问题呢?又怎么解决多余字符呢?
在byte数组写入到文件时,我们可能要先把byte数组读成string然后再通过StreamWriter对象去操作。我这里的场景是讲一现成的方案模板文件.sln直接拖入资源文件中;然后再生成方案文件时从资源读出的。我通过资源文件点文件时得到的返回值竟是一个byte数组。于是就有byte数组转string的这个过程。这里我的模板方案文件拖入资源文件时编码就是UTF-8 + BOM的,所以读取时就如下了:
var xmlSolution = System.Text.Encoding.UTF8.GetString(XPNetTool.CodeGenerator.Global.AppResource.XPNet_Solution2008);
写出时如下:
StreamWriter sw = new StreamWriter(Filename, false, new UTF8Encoding(false));//注意这里的 new UTF8Encoding(false) 是去掉多余字符的关键.
sw.Write(xmlSolution);
sw.Flush();
sw.Close();
其实说来说去就是编码的问题;所以在文件读取操作时一定注意编码前后一致性。
Kevin.Chen
2012-08-15 苏州太仓