八年磨一剑,重新定义HBase——HBase 2.0&阿里云HBase解读

本文内容根据演讲嘉宾PPT以及视频整理而成。

本文分享的内容主要分为以下三个部分:
一、八年磨一剑
二、重新定义HBase
三、生态和案例

首先,本文会为大家分享HBase的前世今生以及HBase在阿里巴巴的发展过程,为大家讲解什么叫做“八年磨一剑”。在这之后将为大家介绍HBase使用的场景以及一些相关问题,希望能够帮助大家更好地理解HBase,帮助大家在未来更好地使用HBase。第二部分将分享对于HBase的重新定义,为大家解读最新的HBase 2.0版本的能力以及其最新的能力到底是什么。此外,因为HBase的生态是开源的,要将HBase用得好,用得方便,用得稳,这中间还欠缺很多企业级软件的能力。而阿里云在这个过程中做了很多的工作,因此在这部分也将为大家介绍阿里云HBase的整体产品形态以及阿里云为了帮助企业和用户更好地使用HBase和享受到HBase的能力做了哪些事情。在第三部分将整体地介绍HBase的生态以及一些实际的客户案例。因为当客户选择使用HBase就不仅仅意味着只使用了HBase,而是代表选择了HBase背后整个大数据生态,因此可以使用整个Hadoop生态的能力,并在这部分的最后将为大家分享一些实际客户的案例,帮助大家更好地使用和理解HBase。

一、八年磨一剑
1. HBase的前世今生
首先为大家分享HBase的发展历程。关系型数据库的发展已经经历了40多年的历史了,而HBase以及大数据这套东西的历史大概从2006年被认为是大数据的发起时期到现在,也就是13年左右而已。那么,为什么会出现HBase以及Hadoop整体生态链的这些内容呢?这是因为在大数据时代,传统数据库需要面对很多挑战,出现了数据量增多、业务复杂度提升、非结构化数据和结构化数据并存等诸多问题。这些问题所带来的最直接的就是成本挑战,因此特别需要价格低廉的数据库来解决问题。
2eec2f6418535c68f71db894b8bc5f1c613a1ff3
这也就是Google提出BigTable开源最佳实现的原因。Google是全球最大的搜索引擎,当他们发现出现的存储成本问题之后,通过内部研究就发出来关于BigTable的这篇论文,而大概在2006年的时候也就发起了HBase这个项目,并且在两年之后其就成为Hadoop的子项目,经过了十几年的发展,目前演变到了2.0版本。HBase能够帮助我们以低成本解决大数据量、高并发、低时延的问题,并且保证了低成本的存储。

2. 阿里的HBase之旅
为何叫做“八年磨一剑”呢?这其实与阿里巴巴对于HBase的研发历程是紧密相关的。在2010年,HBase正式成为了Apache的顶级项目,与此同时阿里巴巴内部的业务也达到了瓶颈期,因此在2010年阿里巴巴开始对于HBase进行预研,经过了持续8年的研发,在2017年的时候输出到阿里云上,并将HBase的能力提供给广大的用户。其实,在阿里集团内部已经有了超过12000台的HBase服务器规模,而最大集群也超过了2000台,这在世界上都是数一数二的,并且也经过了天猫“双11”的历练。
43b00af4af8ac4c6a53750ccf342be1824fb8cca
阿里投入了很多资源和人力来研发HBase,所以开源社区也给予了非常积极的回馈。目前第一个东八区的PMC就诞生在阿里云,而整个阿里集团内有3个HBase PMC、6个Committer以及几十位核心贡献者,并且共享了200多个核心patch。此外,阿里云的HBase版本相比于开源版本在很多方面也有极大的提升。

3. Hbase适合的场景和问题
(1) 关系型数据库与HBase的区别

HBase等NoSQL出现的原因是传统的关系型数据库在面对大数据量、高业务复杂度以及高成本的挑战时,无法对于底层进行优化和改进。如下图所示的表格能够帮助大家对比关系型数据库与HBase的主要区别。

原文链接

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值