pandas mysql 性能_Pandas to_sql()性能为什么这么慢?

我遇到了Pandas和向sqldb写入数据帧的性能问题。为了尽可能快,我使用memSQL(代码中类似于MySQL,所以我不必做任何事情)。我刚才对我的实例进行了基准测试:docker run --rm -it --link=memsql:memsql memsql/quickstart simple-benchmark

Creating database simple_benchmark

Warming up workload

Launching 10 workers

Workload will take approximately 30 seconds.

Stopping workload

42985000 rows inserted using 10 threads

1432833.3 rows per second

那不光彩,只是我的本地笔记本电脑。我知道。。。我也使用根用户,但它是一个丢弃的Docker容器。在

以下是将数据帧写入数据库的代码:

^{pr2}$

下面是函数的%time度量。在

Multi-threading不能加快速度。它保持在7000-8000行/秒的范围内CPU times: user 2min 6s, sys: 1.69 s, total: 2min 8s Wall time: 2min

18s

截图:

6b0fc940f1212ea7cc3ac1d21b39c40a.png

我还增加了max_allowed_packet的大小以批量提交,并使用更大的块大小。还是不快。在

以下是数据帧的形状:netflow_df2.shape

(1015391, 20)

有人知道我怎样才能更快吗?在

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值