列式存储Clickhouse的学习总结

liangdu_Zuker

于 2020-10-26 15:20:55 发布

阅读量420

点赞数

分类专栏：数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010833547/article/details/109290595

版权

数据库专栏收录该内容

22 篇文章 0 订阅

订阅专栏

clickhouse学习

先说性能

根据网上提供的压测报告在机器性能最好的情况下（报告没有给配置）

http://www.dbarun.com/clickhouse/clickhouse-distributed-table-performance-pdf/

写入是25万每秒（算上副本同步时间，这里是按照3个分片，每个分片2个副本，这种拓扑来做压测）

而查询则以列式存储的优势达到了PB级别的秒级查询。

说说特点

系统两个特点:

第一，自动平衡分片。
分片的目的是提高吞吐量。

第二，自动副本高可用。
副本的目的是为了高可用。

总得来说，clickhouse就是表级别的hadoop节点。

用户接口

分片和副本对客户端用户是不可见的，系统会提供一个不存储数据的分布式表给客户端用户，客户端用户看来就是一张普通的MYSQL表无异。

说一说意外

如果有节点奔溃了，该片对应的副本就会自动顶上（因为该分片的副本都是实时一致的）。

如果新增分片呢？那么算法的自平衡机制就会，优先给新节点数据，在达到新的平衡前，吞吐量肯定下降，因为压力无法均匀分发。

解决方案，手工调整，但规则复杂。
清空重导，数据量大耗时不现实。
等待自动回复，吞吐量下降。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
列式存储Clickhouse的学习总结

clickhouse学习先说性能根据网上提供的压测报告在机器性能最好的情况下（报告没有给配置）http://www.dbarun.com/clickhouse/clickhouse-distributed-table-performance-pdf/写入时25万每秒（算是副本同步时间，这里时按照3个分片2个副本来做压测）而查询则以列式存储的优势达到了PB级别的秒级查询。说说特点系统两个特点:第一，自动平衡分片。分片的目的是提高吞吐量。第二，自动副本高可用。副本的目的是为了高可用。总得
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。