HDFS: 存储格式Textfile,Parquet,ORC,适合离线分析,不支持单条记录级别的update操作,随机读写性能差。
HBASE :可以进行高效随机读写,但写快读慢,大批量数据获取时的性能较差。并不适用于基于SQL的数据分析方向。
Kudu:
-
批量更新和单条记录更新都很友好 --FastData
-
与Impala组合使用,OLAP性能强大 --FastAnalytics
-
高可用
-
动态扩展
2、kudu基本概念
==============
-
Table(表):一张table是数据存储在kudu的位置。Table具有schema和全局有序的primarykey(主键)。
-
Tablet(段):一个tablet是一张table连续的segment,与其他数据存储引擎或关系型数据的partition相似。Tablet存在副本机制,其中一个副本为leadertablet。任何副本都可以对读取进行服务,并且写入时需要在所有副本对应的tabletserver之间达成一致性。
-
Tabletserver:存储tablet和为tablet向client提供服务。对于给定的tablet,一个tabletserver充当leader,其他tabletserver充当该tabl