最近学习了大数据与人工智能课程,对自然语言,人工智能这块知识有了一些极为浅显的理解。在这里,我就向大家分享一下自己对HBase区别于RDBMS的理解。
第一 Hbase的概念
我先引用百度上的概念:HBase:非关系型数据库;分布式数据库;基于HDFS为最小存储单元,属于文件存储。列存储。(关系型数据库属于 行存储)
但要搞清Hbase究竟是什么,我们要熟悉两个概念:面向行存储和面向列存储。面向行存储,我们要区别的RDBMS就是这种类型的,面向行存储的数据库主要适合于事务性要求严格地方,或者说面向行存储的存储系统适合OLTP,但是根据CAP理论,传统的RDBMS,为了实现强一致性,通过严格的ACID事务来进行同步,这就造成了系统的可用性和伸缩性方面大大折扣。而目前的很多NoSQL 产 品,包括Hbase,它们都是一种最终一致性的系统,它们为了高的可用性牺牲了一部分一致性,这就为面向列存储,比如Hbase,Casandra,Bigtable都属于面向列存储的分布式存储系统。看到这里,应该有了大概的理解,我再总结 一下:
Hbase是一个面向列存储的分布式存储系统,它的优点在于可以实现高性能的并发读写操作,同时Hbase还会对数据进行透明的切分,这样就使得存储本身具有了水平伸缩性,但同时牺牲一部分一致性。
第二 数据模型TOC
1,Hbase是无模式的,没有固定的列,只定义列簇
浅析Hbase区别于RDBMS
最新推荐文章于 2022-11-04 16:37:49 发布
本文介绍了HBase作为非关系型数据库,与传统的关系型数据库RDBMS的主要区别。HBase是一种面向列存储的分布式系统,具备高性能并发读写、动态列扩展及水平扩展的优点,但不支持条件查询和Master服务器故障切换。它适用于需要大量并发操作和大数据存储的场景。
摘要由CSDN通过智能技术生成