前言
本文隶属于专栏《1000个问题搞定大数据技术体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!
本专栏目录结构和参考文献请见1000个问题搞定大数据技术体系
正文
1、rowkey
- 行键
- table 的主键,table 中的记录按照 rowkey 的字典序进行排序
2、Column Family
- 列族(又称列簇)
- hbase 表中的每个列,都归属与某个列族。列族是表的 schema 的一部分(而列不是),必须在使用表之前定义。
3、Timestamp
- 时间戳
- 每次数据操作对应的时间戳,可以看作是数据的 version 版本号
4、Column
- 列
- 列族下面的具体列
- 属于某一个 ColumnFamily,类似于我们 mysql 当中创建的具体的列
5、cell
- 单元格
- 由{rowkey, column, version} 唯一确定的单元
这里的 column = family + label
- cell 中的数据是没有类型的,全部是以字节数组进行存储