转载:http://www.cnblogs.com/flyinghigher/archive/2010/08/12/1798008.html
http://www.myexception.cn/sql-server/353508.html
用的ADO.Net entity frameWork,也是实体数据的访问方式,等到保存数据(database.SaveChanges())时候,居然一小时没有写完,遂不解,仔细分析,按这样速度需要7个小时。于是换方式,用ADO.net 数据集方式进行,于是用数据集的update,也得三个小时的时间吧。
接下来换sql语句的方式,每几万条数据的时候就执行一次sql的连接字符串,这里用到了stringBuilder,但是速度也是不敢恭维。
第二天,发现了SqlBulkCopy,批量复制,还真是好用,具体用法请查MSDN,请注意设置它的超时时间BulkCopyTimeout属性,否则可是会超时的哦,不过千万级的数据还是会内存溢出的,这里我采用了分批进行复制的方法,即分两次或者三次把这些数据复制到不同的数据表中,最后用T -sql语句进行数据表的对拷。
补充一下:最后用时不超过10分钟。
利用.NET2005表中的一个类 SqlBulkCopy
利用bcp的方式:
private bool SqlBulkCopy(DataTable dt) { SqlConnection cnnSql = new SqlConnection("USER ID=sa;PASSWORD=;INITIAL CATALOG=test;DATA SOURCE=.;"); cnnSql.Open(); try { startTime = DateTime.Now; //数据批量导入sqlserver,创建实例 SqlBulkCopyOptions.UseInternalTransaction采用事务 复制失败自动回滚 System.Data.SqlClient.SqlBulkCopy sqlbulk = new System.Data.SqlClient.SqlBulkCopy(cnnSql);//, SqlBulkCopyOptions.UseInternalTransaction); // System.Data.SqlClient.SqlBulkCopy sqlbulk = new System.Data.SqlClient.SqlBulkCopy(System.Configuration.ConfigurationSettings.AppSettings["ConStr"], SqlBulkCopyOptions.UseInternalTransaction); sqlbulk.SqlRowsCopied += new SqlRowsCopiedEventHandler(OnRowsCopied); //订阅复制完成后的方法,参数是 sqlbulk.NotifyAfter的值 sqlbulk.NotifyAfter = dt.Rows.Count; //目标数据库表名 sqlbulk.DestinationTableName = "INVTDA"; //数据集字段索引与数据库字段索引映射 sqlbulk.ColumnMappings.Add(0, 0); sqlbulk.ColumnMappings.Add(1, 1); sqlbulk.ColumnMappings.Add(3, 3); sqlbulk.ColumnMappings.Add(4, 4); sqlbulk.ColumnMappings.Add(5, 5); sqlbulk.ColumnMappings.Add(6, 6); sqlbulk.ColumnMappings.Add(7, 7); sqlbulk.ColumnMappings.Add(8, 8); sqlbulk.ColumnMappings.Add(9, 9); sqlbulk.ColumnMappings.Add(10, 10); sqlbulk.ColumnMappings.Add(11, 11); sqlbulk.ColumnMappings.Add(12, 12); sqlbulk.ColumnMappings.Add(13, 13); sqlbulk.ColumnMappings.Add(14, 14); //导入 sqlbulk.WriteToServer(dt); sqlbulk.Close(); return true; } catch (Exception ex) { throw new Exception(ex.Message); } finally { dt.Dispose(); cnnSql.Close(); } }
sqlbulk.SqlRowsCopied += new SqlRowsCopiedEventHandler(OnRowsCopied); //订阅复制完成后的方法,参数是 sqlbulk.NotifyAfter的值 sqlbulk.NotifyAfter = dt.Rows.Count;
------解决方案--------------------------------------------------------
将oledb读取的excel数据快速插入的sqlserver中,很多人通过循环来拼接sql,这样做不但容易出错而且效率低下,最好的办法是使用bcp,也就是System.Data.SqlClient.SqlBulkCopy 类来实现。不但速度快,而且代码简单,下面测试代码导入一个6万多条数据的sheet,包括读取(全部读取比较慢)在我的开发环境中只需要10秒左右,而真正的导入过程只需要4.5秒。 using System; using System.Data; using System.Windows.Forms; using System.Data.OleDb; namespace WindowsApplication2 { public partial class Form1 : Form { public Form1() { InitializeComponent(); } private void button1_Click(object sender, EventArgs e) { //测试,将excel中的sheet1导入到sqlserver中 string connString = "server=localhost;uid=sa;pwd=sqlgis;database=master"; System.Windows.Forms.OpenFileDialog fd = new OpenFileDialog(); if (fd.ShowDialog() == DialogResult.OK) { TransferData(fd.FileName, "sheet1", connString); } } public void TransferData(string excelFile, string sheetName, string connectionString) { DataSet ds = new DataSet(); try { //获取全部数据 string strConn = "Provider=Microsoft.Jet.OLEDB.4.0;" + "Data Source=" + excelFile + ";" + "Extended Properties=Excel 8.0;"; OleDbConnection conn = new OleDbConnection(strConn); conn.Open(); string strExcel = ""; OleDbDataAdapter myCommand = null; strExcel = string.Format("select * from [{0}$]", sheetName); myCommand = new OleDbDataAdapter(strExcel, strConn); myCommand.Fill(ds, sheetName); //如果目标表不存在则创建 string strSql = string.Format("if object_id('{0}') is null create table {0}(", sheetName); foreach (System.Data.DataColumn c in ds.Tables[0].Columns) { strSql += string.Format("[{0}] varchar(255),", c.ColumnName); } strSql = strSql.Trim(',') + ")"; using (System.Data.SqlClient.SqlConnection sqlconn = new System.Data.SqlClient.SqlConnection(connectionString)) { sqlconn.Open(); System.Data.SqlClient.SqlCommand command = sqlconn.CreateCommand(); command.CommandText = strSql; command.ExecuteNonQuery(); sqlconn.Close(); } //用bcp导入数据 using (System.Data.SqlClient.SqlBulkCopy bcp = new System.Data.SqlClient.SqlBulkCopy(connectionString)) { bcp.SqlRowsCopied += new System.Data.SqlClient.SqlRowsCopiedEventHandler(bcp_SqlRowsCopied); bcp.BatchSize = 100;//每次传输的行数 bcp.NotifyAfter = 100;//进度提示的行数 bcp.DestinationTableName = sheetName;//目标表 bcp.WriteToServer(ds.Tables[0]); } } catch (Exception ex) { System.Windows.Forms.MessageBox.Show(ex.Message); } } //进度显示 void bcp_SqlRowsCopied(object sender, System.Data.SqlClient.SqlRowsCopiedEventArgs e) { this.Text = e.RowsCopied.ToString(); this.Update(); } } } 上面的TransferData基本可以直接使用,如果要考虑周全的话,可以用oledb来获取excel的表结构,并且加入ColumnMappings来设置对照字段,这样效果就完全可以做到和sqlserver的dts相同的效果了。 获取excel结构的方法可以参考我先前的文章 http://blog.csdn.net/jinjazz/archive/2008/05/13/2441635.aspx