- ClickHouse:官网讲OLAP系统的特点,更像是讲自己的特点,比如关联查询只会有一个大表,写入都是批量等。
Global关键字难于被普通用户理解,join的不足(只有broadcast join,没有repartition join),分布式表定义的繁琐。
需要ZK存储一些元信息,没有master,各节点对等。
对delete和upate支持很弱,无事务支持。
可插拔存储引擎。稀疏索引。
关于为什么快,官网解释说除了列存、索引、多种压缩之外,更在乎底层细节,比如和group by相关的hash数据结构,会有三十多种,适配不同的数据类型和场景。 - HBase:随机IO,解决Hadoop体系点查和RT问题。存在scan的热点问题。
强一致性。
列族压缩,列族内qualifier随意扩展,所以有了OpenTSDB。
它也是BigTable的开源实现。
基于ZK选master leader,并处理region server心跳。
有cache和wal。据说cache也有全局监控和刷盘策略。 - Cassandra:基于Hash分kv,高并发点查无热点,但不便scan。
采用Quorum NRW的一致性方式。
Gossip去中心化,弱一致性。规模化和集群扩展性较好。
算是DynamoDB的开源实现。
有一定的事务性支持,以SQL的表格形式存储数据。
主流数据库/数仓核心要点对比
于 2022-05-23 15:57:46 首次发布