HBase

分布式文件系统(GFS):底层分布式文件系统(GFS)存储的是完全非结构化的。

分布式数据库(Hbase):HBase 存半结构化的,也就是松散数据。

1.数据模型简单,值只存储为字符串

 2.HBase避免了连接操作。

3.基于列存储

4.原始设计只支持行健索引。

5.Hadoop不能满足实时处理需求。

HBase中执行更新操作时,并不会删除数据旧的版本,而是生成一个新的版本,旧有的版本仍然保留(这是和HDFS只允许追加不允许修改的特性相关的)。

纵向扩展: 增加cpu,单核变双核,增加内存,增加磁盘。

水平扩展:允许几千台服务器去存储海量数据。 (可以理解为有效水平切分,就是就有优良的水平可扩展性。)

Pig适合做一些数理统计

数据仓库产品 Hive  有一种HiveQL(类sql)可以去执行复杂的数据分析功能。

Hbase借助底层的HDFS来保证数据冗余备份

而HDFS使用的强一致性来保持的,也就是数据在不同步到N个节点之前,不会返回。

tips:

1.建表。HBase的表中会有一个系统默认的属性作为主键,主键无需自行创建,默认为put命令操作中表名后第一个数据,因此此处无需创建id列。虽然不需要创建即可有id列,但是put时要输入。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值