mpp新增一个字段_HashData实战案例:使用Alluxio构建云原生分析型MPP数据库

请点击上方蓝字,关注我们哦!

本文将介绍北京一家初创企业 HashData (见原文链接1)构建基于云原生的MPP平台的过程。该企业利用对象存储作为数据持久层,Alluxio作为云中的数据编排层,最终构建了一个原生云高性能MPP共享的体系架构。 HashData是由一群来自Pivotal、Teradata、IBM、Yahoo!等开源数据资深人士于2016年创立的。它的旗舰产品HashData WareHouse(HDW),是为云环境构建的数据仓库服务,具有完全兼容的 Greenplum (见原文链接2)分析接口。HDW独特的多集群共享数据库体系架构,在性能、并发性、灵活性和易用性方面取得了很大突破。和许多传统MPP系统采用的非共享体系架构(计算与存储紧耦合)不同,HDW采用了具有解耦和独立对象存储的共享体系架构。这种体系架构的主要挑战在于性能。与传统的块存储相比,对象存储通常性能较低。在本文中,我们将进一步分析HDW如何利用Alluxio作为数据编排层,以消除对象存储带来的性能损失,同时受益于对象存储的可伸缩性和成本效应。

01

为什么使用对象存储服务

如今,对象存储服务(OSS)在原生云架构中一直很重要。正如这篇博客(见原文链接3)所提出的,它提供了更高的可用性、弹性和耐久性,而且成本更低。越来越多的产品和服务支持OSS作为他们的持久文件系统。

  • 节省成本

根据我们的观察,对于许多拥有100TB+数据的用户来说,他们的成本主要来自存储成本,而不是计算成本。一个主要原因是计算完全随需应变,而存储容量在删除数据之前无法回收。因此,当客户考虑各种数据分析选项时,存储成本是一个重要因素。下表为中国全栈ICT服务及解决方案(包括公共云服务)供应商QingCloud(见原文链接4)在PEK3区域的块存储和对象存储的价格对比。OSS的成本大约是单副本块存储的1/4,多副本块存储的1/5。

110cb03f53c7a4242d5e4ab23b52b46b.png

弹性也会影响存储成本。虽然块存储支持在线扩展,但是弹性计算机(即将扩展的块存储卷连接到它)在扩展期间会导致HDW集群短暂停机。因此,客户通常会保留额外的块存储容量,以避免在短时间内再次扩展,从而导致成本更高。 总之,基于OSS的数据仓库解决方案的存储成本大约是使用传统块存储成本的1/10。
  • 系统灵活性

让我们来看一个典型的数据分析场景,尤其是在物联网和电信行业:随着时间的推移,越来越多的数据生成并被导入到数据仓库系统中。通常,由于应用程
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值