阿里云数据库HBase版有哪些应用场景与产品优势?

原创 2018年04月15日 15:45:01

阿里云数据库HBase版有哪些内核优势?

  • 内核在集团数百个集群使用、数百个业务、10000台左右规模、服务天猫双十一
  • 跟踪开源社区改进
  • 修复bug,改进内核性能
  • 增强功能,如支持 公网、内网 同时访问、支持OSS等
  • 运维主动推送升级,用户无感知

低成本

  • 多种形态研发中,满足不同规模的需求
    • 虚拟机 + 高效云盘 系列(当前):满足小数据量,200g ~ 20T规模的数据需求,写入写入频繁,随机读一般的场景
    • 虚拟机 + SSD云盘 系列(当前):满足小数据量,200g ~ 20T规模的数据需求,写入写入频繁,随机读高的场景,延迟低的场景
    • HBase on OSS系列(研发中): > 100g起步, 成本便宜,满足日志、聊天等消息归档的需求,写入频繁但是读取较小的场景
    • 本地实例:虚拟机 + SATA本地盘(研发中) >30T起步:成本便宜,但是规格固定,不能单独存储扩容,满足计算、读取频繁、数据量大的场景
    • 本地实例:虚拟机 + SSD(研发中) >2T起步 :成本便宜,但是规格固定,不能单独存储扩容,满足计算、读取频繁、随机读高、延迟低的场景
  • Master多种规格:最小2cpu4g(待上),2cpu4g是入门级别,一般情况下4cpu8g即可

有需要购买阿里云产品的朋友,先领取阿里云幸运券,再购买云数据库HBase版,领取使用后可有返现优惠。 

支持SQL及二级索引

  • 支持通过 SQL 访问数据库数据
  • 高效的二级索引方案让您查询数据更加便捷高效

扩展性

  • 支持在线增加节点,且可以平滑增加资源,如每个月增加1台
  • 支持在线增加容量,且可以平滑增加资源,如存储量每月增加100g
  • 计算量:从1k qps 到 5000w qps(满足大部分的需求)
  • 存储量:从200g到1p (满足大部分的需求)

数据可靠性

  • 99.99999999%的数据可靠性

高性能

  • 基于1.1改造,服务集团业务与云上业务,性能提升30% ~ 300%

高可用性

  • 自动负载均衡
  • 默认HA
  • 对集群服务进程自动守护
  • 单节点故障时可秒级故障迁移
  • 独占资源,可靠稳定,不受其它用户干扰

生态完整

  • 完全兼容开源、与Hadoop生态完美融合
  • 内部支持Phoenix组件

易运维

  • 15分钟内完成部署
  • 可视化web控制台
  • 全指标监控预警
  • 修改配置等

数据访问安全

  • 支持网络白名单
  • VPC网络隔离、
  • 基于阿里云AK访问集群(待上)、支持ACL

多形态支持

  • 支持不同规格,不同场景的需求
  • 支持独享、普通实例
  • 支持SSD云盘、高效云盘
  • 支持OSS存储(研发中)
  • 支持本地实例(研发中)

一致性

  • 目前支持强一致性,后续可以在客户端自由选择CP模型、还是AP模型

支持阿里云产品打通

  • 与EMR hadoop、spark连通,正在产品打通logservice、ODPS、Blink等(待上)

数据导入导出

  • 支持关系型、ODPS、EMR等数据源与ApsaraDB HBase导入导出,参考 数据同步

应用场景

ApsaraDB for HBase的使用场景比较广泛,以至于很多客户无法把握他。以下我们大致列下,适合的场景:

场景

HBase的设计之初是为了存储互联网,几乎所有非事务类结构化的存储需求都可以使用HBASE来满足。HBase是NoSql,讲的是Not only SQL,也是支持SQL及二级索引的。在整个数据的世界里,事务是比较少,占了不到1%的份额,大部分的数据存储都是无事务的。

目前阿里的使用情况:

阿里hbase

在讲述具体的HBase场景,我们先看下HBase在整个数据处理大图之间的位置:数据流

云HBase处于数据存储的位置,自带分析的功能

1、数据来源的途径有:

  • 通过业务 ECS 直接写入到 云HBase之中
  • 有一些消息中间件自带push功能,可以直接写入到HBase之中;有一些不行,需要拉取消息再转化处理后写入到HBase之中
  • 通过流式系统,比如:SparkStreaming、Flink、Storm等流式引擎计算写入到云HBase之中
  • 从离线同步数据到云HBase之中,一般为T+1同步
  • 从关系型数据库同步数据到云Hbase之中,可以做到实时同步
  • 在机器学习场景中,直接把云Hbase作为存储

2、云HBase的数据的去向:

  • 云HBase自带Phoenix模块分析,支持百亿的毫秒级别分析
  • 通过Spark等离线分析引擎分析
  • ECS业务端查询,如Scan一些数据,在客户端展示

物联网大数据

物联网

HBase天生适合物联网的场景,比如:单车、物流轨迹类 等等

大数据类

大数据类

满足安全风控、大数据处理、搜索等等具体的场景,一般跟流式系统、离线系统结合

大数据存储类、包括历史数据存储

海量数据存储

存储包括各类数据,比如:日志、订单、交易数据、消息等等,在线实时写入,在实时查询。历史数据查询批量低,需要分层存储,云HBase预计在12月份支持冷热数据分离存储,降低存储成本

实时分析类

分析类

在百亿的数据量下,秒级别返回数据,适合 报表、统计等需求

版权声明: https://blog.csdn.net/qq1695381214/article/details/79949858

解决BoundsChecker和VC打架的方法

原来是必须在BC的Setting中设置Suppressing选项,比如要调用MFC42.dll,默认的要求试掉用后,再程序退出是必须释放这个库,事实上WIndows的其他程序要用,不能释放,这就造成了...
  • xiaozuo
  • xiaozuo
  • 2001-01-22 10:41:00
  • 1229

ApsaraDB-HBase产品技术文档

  • 2017年12月28日 17:32
  • 2.63MB
  • 下载

HBase 和RDBMS(关系数据库)的比较

一 为什么会有NOSQL 普通的数据库无法满足大规模的数据处理,ACID无法满足基本需求,所以需要从架构上去改变。NOSQL通过访问缓存来节省查询的开销。 二 什么是Hbase Hbase是一个...
  • xuyaoqiaoyaoge
  • xuyaoqiaoyaoge
  • 2015-07-23 10:59:29
  • 1470

Hbase总结(五)-hbase常识及habse适合什么场景

当我们对于数据结构字段不够确定或杂乱无章很难按一个概念去进行抽取的数据适合用使用什么数据库?答案是什么,如果我们使用的传统数据库,肯定留有多余的字段,10个不行,20个,但是这个严重影响了质量。并且如...
  • lifuxiangcaohui
  • lifuxiangcaohui
  • 2014-10-08 15:38:53
  • 48889

常用数据库的特点、应用场景信息整理

关系型数据库     关系数据库,是建立在关系模型基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中的数据。现实世界中的各种实体以及实体之间的各种联系均用关系模型来表示。关系模型是由埃德加...
  • junshi66
  • junshi66
  • 2014-08-05 15:39:05
  • 11536

语音识别类产品的分类及应用场景

前言:本文作者@焦糖玛奇朵,是我们“AI产品经理大本营”早期成员,下面是她分享的第1篇文章,欢迎更多有兴趣“主动输出”的朋友们一起加入、共同进步:)音频由公众号“闪电配音”提供媒体和AI巨头们乐于给大...
  • pA2elX78qaJTADH
  • pA2elX78qaJTADH
  • 2017-12-28 00:00:00
  • 406

云服务器的优势(阿里云)

本文重点介绍一下云服务器的优势,由于作者本人主要使用的阿里云的云服务器ECS,因此本文将直接以阿里云ECS为例相对于其他产品进行对比介绍,文章仅仅从个人使用体验角度出发,因此对于整个云服务器的优势来讲...
  • opengps
  • opengps
  • 2017-10-15 18:13:26
  • 704

阿里云HBase性能测试

阿里云HBase性能测试结果: https://yq.aliyun.com/articles/198654?spm=5176.doc49504.2.3.gW0gOk...
  • ArivnXu
  • ArivnXu
  • 2017-11-01 15:55:20
  • 220
收藏助手
不良信息举报
您举报文章:阿里云数据库HBase版有哪些应用场景与产品优势?
举报原因:
原因补充:

(最多只允许输入30个字)