目录
HBase简介
HBase是Apache旗下的一款高可靠性,高性能,面向性,可伸缩的分布式数据库,利用了Hbase技术可以在廉价的PC服务器上搭建大规模的存储化集群,使用HBase可以对数十亿级别的大数据进行实时性的高性能读写,在满足高性能 的同时还保证了数据存取的原子性。
相关背景
随着数据规模越来越大,大量业务场景开始考虑数据存储的水平扩展,使得存储服务可以快速执行客户端发来的请求,而目前的关系型数据库更专注一台机器。海量数据量存储成为提升应用性能的瓶颈,单台机器无法负载海量的数据处理,随之而来的出现了很多的分布式存储解决方案,HBase就是其中之一。
HBase--DataBase on Hadoop,基于分布式文件系统上面建立的数据库,HBase是面向列的开源数据库。开源团队根据2008年Google发布了一篇关于Google搜索引擎BigTable的核心思想的论文,实现了基于分布式文件系统的列数据库。随后加入Apache基金会,成为Hadoop生态圈中的顶级项目被大家熟知。
CAP理论
有的专家尝试将关系型数据库做成分布式数据库,把压力分摊到多个服务器上,但是,随之而来的问题则是很难保证原子性。增加一些操作可以保证原子性,但是性能又大幅度下降了。专家们始终没有办法构建一个即有完美原子性又兼高性能的分布式数据库。就在一筹莫展的时候有人想起。20世纪90年代初的Berkerly大学Eric Brewer 教授提出了CAP理论。CAP理论全称是 Consistenc