手头上有个活,需要将一个大的数组存储为CSV格式的文件,于是循着天下代码一大抄的思路,先在网上搜罗了一下,得到的大多写入方式如下:
System.IO.StreamWriter sw = new System.IO.StreamWriter(fs, System.Text.Encoding.UTF8);
string data = "";
for (int i = 0; i < val.GetLength(0); i++)//
{
for (int j = 0; j < val.GetLength(0); j++)//
{
data += val[i,j].ToString();
if (i < val.GetLength(0) - 1)
{
data += ",";
}
}
sw.WriteLine(data);
}
sw.Close();
这个方法时先将数据转化为字符串,然后以长字符串的方式写入,执行过程中发现,该种方法不仅效率低下,生成的文件也奇大无比。
效率低大概是因为把一大串数组先转成一个大字符串,然后写入。
存储大的原因大概是因为字符串需要的存储空间要大一点吧。
我有个420 X 420的整型数组,按照这种格式存的CSV文件大约90MB,excel打开时还会提示无法完整打开(提示 “File not loaded completely!"),当时感觉好奇怪,觉得CSV文件的效率也太低了吧。
后来换了个思路,代码改成:
for (int i = 0; i < val.GetLength(0); i++)
{
for (int m = 0; m < val.GetLength(0); m++)
{
//data += val[i, m].ToString();
sw.Write(val[i, m]);
if (m < val.GetLength(0) - 1)
{
sw.Write(", ");
}
}
sw.Write("\n");
}
sw.Close();
发现执行效率不仅高了,(免去了转化为大字符串的折腾),存贮的文件也小了很多,同样的矩阵,只要600KB的存储就够了。大概是文件直接存储的整形变量,空间得到了极大的节省。