hbase

1.

  • hbase是bigtable的开源山寨版本。是建立的hdfs之上
  • 它介于nosql和RDBMS之间
  • 仅能通过主键(row key)和主键的range来检索数据
  • 仅支持单行事务(可通过hive支持来实现多表join等复杂操作)
  • 主要用来存储非结构化和半结构化的松散数据。
  • 与hadoop一样,Hbase目标主要依靠横向扩展,通过不断增加廉价的商用服务器,来增加计算和存储能力。

2.表特点: 

  • 大:一个表可以有上亿行,上百万列
  • 面向列:面向列(族)的存储和权限控制,列(族)独立检索。
  • 稀疏:对于为空(null)的列,并不占用存储空间,因此,表可以设计的非常稀疏。

3.数据模型 为wide column模型

行键时标专栏家庭 contents专栏家庭 anchor专栏家庭 people

“ com.cnn.www”

9天

 

anchor:cnnsi.com =“ CNN”

 

“ com.cnn.www”

8天

 

anchor:my.look.ca =“ CNN.com”

 

“ com.cnn.www”

6天

contents:html =“ <html> ...

  

“ com.cnn.www”

t5

contents:html =“ <html> ...

  

“ com.cnn.www”

3天

contents:html =“ <html> ...

  

“ com.example.www”

5天

contents:html =“ <html> ...

 

people:author =“ John Doe”

分为两行(“ com.cnn.www”,“ com.example.www”),三列族(contents,anchor,people),一个列族中有一列(contents:html/people:author)可以有多列,空列在实际表中不存在。时标为version

{
  "com.cnn.www": {
    contents: {
      t6: contents:html: "<html>..."
      t5: contents:html: "<html>..."
      t3: contents:html: "<html>..."
    }
    anchor: {
      t9: anchor:cnnsi.com = "CNN"
      t8: anchor:my.look.ca = "CNN.com"
    }
    people: {}
  }
  "com.example.www": {
    contents: {
      t5: contents:html: "<html>..."
    }
    anchor: {}
    people: {
      t5: people:author: "John Doe"
    }
  }
}
ROW                                     COLUMN+CELL
 1001                                   column=contect:mail, timestamp=1522202414649, value=liupliup@cn.ibm.com
 1001                                   column=contect:phone, timestamp=1522202430196, value=15962459503
 1001                                   column=group:number, timestamp=1522202455929, value=1
 1001                                   column=info:age, timestamp=1522202371257, value=34
 1001                                   column=info:name, timestamp=1522202364156, value=liupeng

 

3.hbase shell命令

  •  连接到hbase 安装目录中 ./bin/hbase shell
  • version
  • whoami
  • status
  • list :列出所有表
  • describe 'table'
    • {NAME => 'dynamic', BLOOMFILTER => 'ROW', VERSIONS => '1', IN_MEMORY => 'false', KEEP_DELETED_CELLS => 'FALSE', DATA_BLOCK_ENCODING => 'NONE', TTL => 'FOREVER', COMPRESSION => 'NONE', MIN_VERSIONS => '0', BLOCKCACHE => 'true', BLOCKSIZE => '
      65536', REPLICATION_SCOPE => '0'} 
    •  NAME => 'info', //列族
       DATA_BLOCK_ENCODING => 'NONE', //数据块编码方式设置
      
       BLOOMFILT => 'ROW'
      
       REPLICATION_SCOPE => '0', //配置HBase集群replication时需要将该参数设置为1.
             
       VERSIONS => '1', //设置保存的版本数
      
       COMPRESSION => 'NONE', //设置压缩算法
      
       MIN_VERSIONS => '0', //最小存储版本数
      
       KEEP_DELETED_CELLS => 'false', //参见:http://hbase.apache.org/book.html#cf.keep.deleted
      
       BLOCKSIZE => '65536', //设置HFile数据块大小(默认64kb)
      
       IN_MEMORY => 'false',//设置激进缓存,优先考虑将该列族放入块缓存中,
                            //针对随机读操作相对较多的列族可以设置该属性为true
      
       BLOCKCACHE => 'true' //数据块缓存属性
  • is_enabled 'tablename'  检查表是否启用
  • count 'user_dynamic' 计算数量
  • scan 'Test',{LIMIT=>10}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
该资源内项目源码是个人的课程设计、毕业设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 该资源内项目源码是个人的课程设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值