Hbase是一种数据库:hadoop数据库。描述:一种稀疏的、分布式的、持久化的、多维有序映射,它基于行健(rowkey)、列键(columnkey)和时间戳(timestamp)建立索引。
HBase使用场景:
1. 典型的互联网搜索问题
2. 抓取增量数据
2.1抓取监控指标:OpenTSDB
2.2抓取用户交互数据:facebook和stumbleUPon
2.3遥测技术:MOzilla和TrendMicro
2.4广告效果和点击流
3. 内容服务(Twitter帖子、facebook帖子、Instagram图片和微博等)
3.1 URL短链接
3.2 用户模型服务
4. 信息交换
Facebook短信系统要求:高的写吞吐量,极大的表,数据中心内的强一致性。除了短信系统之外其他应用系统要求:高的读吞吐量,计数器吞吐量,自动分库。Facebook每天交换数十亿条短信,每天带来大约750亿次操作。尖峰时刻,facebook的hbase集群每秒发生150W次操作。从数据规模角度来看,facebook的集群每月增加250TB的新数据。
创建简单表
1.创建表mytable,列族名是cf
>create ‘mytable’, ‘cf’
2.写数据
>put ‘mytable’,’first’,’cf:message’,’helloHBase’
3.读数据
>get ‘mytable’,’first’
或者扫描整个表
>scan ‘mytable’