greenplum数据入库方式总结及性能对比

最新推荐文章于 2024-05-04 01:57:45 发布

奋斗, 拼

最新推荐文章于 2024-05-04 01:57:45 发布

阅读量6.2k

点赞数 3

分类专栏： Greenplum 文章标签： greenplum数据入库方式总结及性能对比 greenplum入库性能对比

本文链接：https://blog.csdn.net/u011563666/article/details/100021102

版权

10 篇文章 2 订阅

订阅专栏

greenplum目前主要使用到的入库方式有如下4种：

详细优缺点及性能对比如下：

入库方式	优点	缺点	入库性能	是否支持事务
insert into	直接使用jdbc方式入库，支持事务	入库性能较差，对于update，insert等操作或锁表	500条/s	支持
gpss	使用gpss+gpfdist方式入库，分布式并行入库，入库性能最好	单个gpss只能一个session（多个session连接不稳定），一个批次数据入库大小不能超过4MB	1万+条/s	不支持
gpkafka	使用gpss+kafka+gpfdist方式入库，分布式并行入库，入库性能最好	一个gpkafka服务只能对应一个topic，对应一张表	1万+条/s	不支持
gpcopy	使用greenplum的gpcopy入库	所有数据入库都要经过greenplum的master节点，入库性能受限于master节点（带宽，cpu，内存）	1万+条/s	不支持

注意：以上测试环境为内存：16GB，CPU：8 core，磁盘：500GB。

说明：若使用gpss，建议一张表对应一个gpss服务，需要注意每个writeRequest数据量不超过 4MB，该数据量大小目前官方并未提供参数可供配置。

关注

专栏目录