(原文地址:
http://blog.csdn.net/codemosi/article/category/2777041,转载麻烦带上原文地址。hadoop hive hbase mahout storm spark kafka flume,等连载中,做个爱分享的人
)
Hbase 是在hadoop上的一个分布式的NOSQL数据库。
![奋斗](http://static.blog.csdn.net/xheditor/xheditor_emot/default/struggle.gif)
Row Key
|
Timestamp
|
Column Family
|
|
1
|
|
|
|
r1
|
t3
|
url=http://
|
title=
|
t2
|
host=com
|
|
|
t1
|
|
|
|
r2
|
t5
|
url=http://
|
content=每天…
|
t4
|
host=com
|
|
|
(HBase数据模型-百度百科)
1:Row Key: 行键,Table的主键,Table中的记录默认按照Row Key升序排序
2:Timestamp: 时间戳,每次数据操作对应的时间戳,可以看作是数据的version number
3:Column Family:列簇,Table在水平方向有一个或者多个Column Family组成,一个Column Family中可以由任意多个Column组成,即Column Family支持动态扩展,无需预先定义Column的数量以及类型,所有 Column均以 二进制格式存储,用户需要自行进行类型转换。