现在我们有一个简单的需求,一个DataRow里面1万列(创建它的DataTable有1万列),我们要把它增加一列并为这个Cell更新一个数据。
DataRow根本没有添加Column的的方法,我们自然而然会想到复制DataRow的方法。其实也可以一个cell一个cell地复制,但是我们发现可以通过DataRow的ItemArray一次性导入到新的DataRow。
请参看下面代码,我们定义了一个10列的DataTable,然后在添加一行数据时,动态把DataTable扩展到10000列,由于我们一开始的DataRow是由原始的10列的Table创建的,所以需要同时动态扩展我们的DataRow,这是我们就要用到DataRow的复制。
但是这总方法在当量数据是效率非常低,就下面这个代码,足足运行了13秒,占据内存960MB, 而且GC没有自动回收(不明白为什么没有自动回收临时DataRow变量)。
这个问题其中一个原因:10000列,每添加一个列,都要把前面的所有列复制一遍。
//Total Column count
int cnt = 10000;
//Define table with 10 columns
int fixsize = 10;
DataTable dt = new DataTable();
for (int i = 0; i < fixsize; i++)
{
string colName = "C" + i.ToString();
dt.Columns.Add(colName, typeof(float));
}
//Add 1 dataRow and extend to 10000 columns dynamically
DataRow dr = dt.NewRow();
for (int i = 0; i < cnt; i++)
{
string colName = "C" + i.ToString();
add new columns
if (i>= fixsize)
{
dt.Columns.Add(colName);
//copy datarow
DataRow dr1 = dt.NewRow();
dr1.ItemArray = dr.ItemArray;
dr = dr1;
}
//update data
dr[colName] = i * 1.1;
}
//Add 1 row to table
dt.Rows.Add(dr);
这边我们利用ArrayList实现了高效率的DataRow复制,代码如下,这样在添加Column的过程中没有复制过程,只是添加到ArrayList, 直到最后再一次性复制到DataRow.
运行时间:0.03秒,内存 30MB
//Total Column Count
int cnt = 10000;
//Define table with 10 columns
int fixsize = 10;
DataTable dt = new DataTable();
for (int i = 0; i < fixsize; i++)
{
string colName = "C" + i.ToString();
dt.Columns.Add(colName, typeof(float));
}
//Add 1 datarow and extend columns to 10000
DataRow dr = dt.NewRow();
ArrayList al = new ArrayList(dr.ItemArray);
for (int i = 0; i < cnt; i++)
{
string colName = "C" + i.ToString();
//column index < fixsized
if (i<fixsize)
{
al[i] = i * 1.1;
}
else
{//add new columns
dt.Columns.Add(colName);
al.Add(i * 1.1);
}
}
//define new row with 10000 columns
dr = dt.NewRow();
//populate 10000 cells data to dataRow from ArrayList
dr.ItemArray = al.ToArray();
dt.Rows.Add(dr);