(总结了下网上现有的对三个平台的评价,待续。。)
CDH
最成型的发行版本,拥有最多的部署案例。提供强大的部署、管理和监控工具。Cloudera开发并贡献了可实时处理大数据的Impala项目。拥有强大的社区支持,当出现一个问题时,能够通过社区、论坛等网络资源快速获取解决方法。
-
- 费用
- 宝贵的特点
- 费用
Cloudera Manager 是 提供易用性、特性、易于升级和安装组件等最有价值的功能。CM也可以在几分钟之内建立集群主节点的高可用性(high availability)。其他功能,例如,Hive,Pig,Impala,Flume和Spark也是极具价值的。
-
- 改善公司现状
改进了存储和分析工具的可用性,如Hive,Pig,Impala和Spark的使用。
-
- 改善之处
Impala的不断改进。(Impala 是基于HDFS的SQL工具,cloudera开发,现开源。)
Impala为Hadoop上的 BI /分析查询 提供低延迟和高并发性(不由批处理框架(如Apache Hive)提供)。 Impala也可以线性扩展,即使在多租户环境中也是如此。利用与Had