HDFS和hbase

CQbrant

于 2016-11-21 23:38:48 发布

阅读量1.8w

点赞数 3

分类专栏： hadoop 文章标签： hbase hadoop hdfs 分布式文件系统

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cquptcmj/article/details/53270353

版权

本文介绍了HDFS的特性和优势，如存储大量数据、高可靠性，以及其在高速流数据读取上的优化，但同时也指出其在随机读取和更新操作上的不足。接着，介绍了HBase作为分布式列式存储系统，适合处理非结构化数据，提供快速随机访问，且与HDFS相结合使用，可以应对不同场景的需求。文章强调了根据数据的使用模式和计算需求选择合适的数据存储方案的重要性。

摘要由CSDN通过智能技术生成

HDFS

hdfs简介

hadoop中高效数据处理基础是它的数据存储模型
hdfs是hadoop分布式文件系统的实现
它是参考谷歌文件系统设计
hdfs为处理大批大量数据而设计
通过网络提供给多个分部的客户端易用的数据访问方式

hdfs优势

相比于nfs之类的分布式文件系统，hdfs可以存储大量数据并支持更大的文件
hdfs是为在大量机器和文件系统之间传输数据而设计的
hdfs具有可靠的数据存储能力，并通过数据副本的方式处理集群中的某台机器宕机或数据丢失的情况
hdfs于hadoop的mapreduce模型易于集成，因此，允许数据从本地读取和处理

hdfs的不足

hdfs并非一个通用的应用程序，而是局限于某些特定的场景
hdfs优化了高速流数据读取性能，代价则是随机读取性能上的削弱
访问hdfs文件最好采取顺序读取的方式
hdfs只支持在文件上做少数的操作，但不包括任何更新的操作
hdfs不提供数据的本地缓存机制

HBase

HBase是一个分布式的，本地化的，面向列的，多维度的存储系统，在设计上具备高性能和高可用性。
* hbase是goole的bigtable架构的开源实现
* 与传统的关系型数据库管理系统类似，hbase中也是以表的形式组织数据
* hbase支持非常松散的结构定义，但不支持任何表连接joins，查询数据或sql操作
* hbase主要在大稀疏表上做crud操作
* 大多是hbse

最低0.47元/天解锁文章

关注

3
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。