大数据导入到mysql视频_大规模数据导入和导出(mysql)

测试数据2.5G,共有数据9427567条。用的mysql的large服务器的配置。

load 一次需要大概10分钟左右。

建的表用的是MYISAM,调整了几个session的参数值

SET SESSION BULK_INSERT_BUFFER_SIZE = 256217728 ;

SET SESSION MYISAM_SORT_BUFFER_SIZE = 256217728 ;

运行结果如下

Query OK, 9427567 rows affected, 1558 warnings (3 min 55.21 sec)

Records: 9427567 Deleted: 0 Skipped: 0 Warnings: 0

google到的还可以

set global KEY_BUFFER_SIZE = 256217728 ;

alter table tablename disable keys ;

如何load 数据里面带反斜杠(backslash)”\” 的数据

由于如果你没有指定FIELDS子句,则默认值为假设您写下如下语句时的值:

FIELDS TERMINATED BY ‘\t’ ENCLOSED BY ” ESCAPED BY ‘\\’

所以,如果你的数据里面有反斜杠(backslash)”\”的时候,数据会出现被截断的问题。出现这种问题,只要写上如下的fields子句即可

FIELDS TERMINATED BY ‘\t’ ENCLOSED BY ” ESCAPED BY ”

如何load 不同编码的数据

原来用的4.X的mysql,我是select into   outfile ,只后用iconv,或者其他软件来做。可以参考这里 ,但是由于这次数据大,用ultraedit等软件打开都要半天。好在新版的mysql可以增加一个新的参数

CHARACTER SET gbk

我的文本数据是GBK的编码,数据表是utf8的,用这种方法测试成功。

如何load 的时候只insert特定的列

比如表里面有比元数据多的列。可以在load 的时候指定要插入的字段名字。

示例的代码如下:

LOAD DATA INFILE ' ~/data.txt '

INTO TABLE fb0505

CHARACTER SET   gbk

FIELDS TERMINATED BY ' \t ' ENCLOSED BY '' ESCAPED BY ''

LINES TERMINATED BY ' ' STARTING BY ''

( seller_id , fb_type , fb_date , item_url ) ;

其中表fb0505里面还有一列是id。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值