分布式数据库HBase(一)

最新推荐文章于 2024-06-22 10:05:57 发布

小太阳的blog

最新推荐文章于 2024-06-22 10:05:57 发布

阅读量2.1k

点赞数

分类专栏：工作

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jerrygirl/article/details/83014779

版权

工作专栏收录该内容

4 篇文章 0 订阅

订阅专栏

1. 从BigTable 说起

解决google公司大规模搜索网页的问题。google公司通过BigTable 存储大量的网页。但现在很多都需要使用，不是使用磁盘进行存储。GFS

底层，完全非结构化数据。

Hbase 是BigTable 开源实现。

Mapreduce不能进行实时处理。数据爆炸式增长，传统型关系数据库处理有限，导致处理能力捉襟见肘。

关系型数据库一旦确定模式后，再去更改模式，就需要短暂的听觉操作，维护完后，在上线。

应用程序读出来来了，再去解释数据模型。

多表链接操作，效率低。在Hbase中避免了。完整性信息存在一张表里，避免了链接查找。

过了一定时间后，才会清楚旧的版本，新增一个新版本，生成一个时间戳。

数据仓库分析时：

Pig，写一条执行一条，类似于sql,比较适合做数据库统计。

Hive数据仓库，提供了Hive sql ，访问底层的Hbase中的数据。使用Hivesql ,执行复杂的多维数据分析功能，对很多企业来说非常关键。

列族，动态扩展，增加、删减等。

冗余存储，提高分析效率。

列族，基本单元，存到不同文件里。

小太阳的blog

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分布式数据库HBase(一)

1. 从BigTable 说起解决google公司大规模搜索网页的问题。google公司通过BigTable 存储大量的网页。但现在很多都需要使用，不是使用磁盘进行存储。GFS底层，完全非结构化数据。Hbase 是BigTable 开源实现。Mapreduce不能进行实时处理。数据爆炸式增长，传统型关系数据库处理有限，导致处理能力捉襟见肘。关系型...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。