行终止符导致的bulk insert 失败

前言


在论坛中回答了一个问题,导入csv 数据,并对导入的数据增加一个新的列date datetime。 要求在10s内完成,200w行数据的导入.分享下解决问题的思路和方法

分析


通常来讲Bulk insert 比 BCP 更快一点,我们选择Bulk insert的方式。
提出的解决方案:先把数据导入到sql server 的临时表,然后再插入目标表。
具体语句如下:

bulk insert test07232
from 'D:\2017-7-22.csv'
WITH (
FIELDTERMINATOR = ',',
ROWTERMINATOR = '/n'
)
SELECT * ,GETDATE() AS Date INTO ttt
FROM test07232


但是他提供的的csv 进行导入时,提示如下错误

消息 4866,级别 16,状态 1,第 1 行
大容量加载失败。数据文件中第 1 行的第 2 列太长。请验证是否正确指定了字段终止符和行终止符。
消息 7399,级别 16,状态 1,第 1 行
链接服务器 "(null)" 的 OLE DB 访问接口 "BULK" 报错。提供程序未给出有关错误的任何信息。
消息 7330,级别 16,状态 2,第 1 行
无法从链接服务器 "(null)" 的 OLE DB 访问接口"BULK"提取行。


这是由于行终止符无法识别导致的。使用notepad++打开csv文件,在视图中选择显示行尾号。

可以看到文件的换行符是LF



而对于正常的csv问题 默认是用CRLF作为换行符的


因此上面的bulk insert 语句无法正常执行。

解决



1.首先想到的是修改数据源头,让源头产生正常的数据,但是源头数据不好修改
2.用程序,写c#处理,,太费时间
3.最后终于找到了正确的办法

bulk insert test07232
from 'D:\2017-7-22.csv'
WITH (
FIELDTERMINATOR = ',',
ROWTERMINATOR = '0x0a'
)

SELECT * ,GETDATE() AS Date INTO ttt
FROM test07232
最后全部都在SSD 上,导入用时2s。生产正式表1s 。整个过程3s完成。

总结

解决问题要从各个问题入手,找到原因才更好的解决问题
  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值