大数据公司基因不同侧重点也不同,有的做PaaS有的做SaaS,有的做SI,每一家都会根据自己的产品定位、适用的业务场景突出大数据平台的能力。而客户和用户更关注你的大数据平台是什么架构具有哪些技术能力。以下抛开零碎的技术细节,概括性系统性的分享大数据平台的能力。
-
基于存储和计算分离的架构
在传统MPP架构下,计算存储共享一个节点,每个节点有自己独立的CPU、内存、磁盘资源,互相不共享,不太容易满足云时代不同场景下的不同workload需求。
而通过分离存储资源、计算资源,可以独立规划存储、计算的资源规格和容量。这样计算资源的扩容、缩容、释放,均可以比较快完成,并且不会带来额外的数据搬迁的代价。存储、计算也可以更好的结合各自的特征,选择更适合自己的资源规格和设计。
-
基于云原生的数据平台
基于云平台进行构建、部署和交付的数据库服务。
公有云和私有云部署:支持微软、亚马逊、阿里云等公有云平台。
容器部署支持:Docker与Kubernetes。
-
面向开源生态的存储引擎
与Hadoop生态融合。
Hadoop Native:从存储(HDFS),资源管理(YARN)到部署(Ambar