工作需要,这几天需要做一些数据导出到CSV文件的工作。翻出以前的文件操作代码,过程中遇到了之前没有遇到过的问题,这里记录一下。
主要遇到的问题就是两个,一个是导出CSV文件时的分隔符(英文逗号)的处理,会出现结果与目的不一致的问题,第二个就是文件组织及输出的效率问题。
1、CSV分隔符问题,网上有一堆的文章介绍,实际情况还是要自己搞懂。自己还是特意手撸了一些实验代码。基本上跟一些注意事项一样。这里只说结果,就不附上代码了。
如果要输入的数据要保留英文逗号,需要用双引号符号把目的数据包起来,做成字符串数据导出。举例:
string dataA = "i can do, anything for you.";
string dataB = "456";
想要保证dataA的数据导出后,用Excel打开时不被分开,这里做如下处理。
dataA = string.Format("\"{0}\"", dataA);
这样包起来即可。输出后,用Excel打开时,就不会被认为是两个数据了。还有一个就是如果dataA中本来就有英文的双引号,导出是没有问题,但用Excel打开后,就看不到双引号了。还想保留双引号在Excel单元格里的显示。那就需要在使用双引号符号包住数据前,再多做一个处理,这个处理如下:
string dataA = "\" i can do, anything for you.\"";
string dataA = dataA.Replace("\"", "\"\"");
dataA = string.Format("\"{0}\"", dataA);
这样就可以既保留原本需要保留的双引号,又不会打开时分割成两个数据了。各位可以自行手撸几行代码看看。这里就不展开了。
2、输出文件组织时,运行效率不高。都知道文件输出时或者写文件时,基本上都会调用
stream的write函数,一次性写入文件内容。但是需要在之前整理好文件内容到一个字符串中统一做处理。在这个过程中,字符串越大,后面的处理就越慢。尤其是批量组织文件内容的时候,文件越多,文件越大,这个等待的时间简直令人发指。
各位可能知道StreamWriter这个类,它带有一个WriteLine的函数,可以按行输出文件。只是需要将输出的文件整理到数组或者list里。没什么可说的。这里记录一下,算是给自己的一个交代