HBase入门(一)

HBase入门(一)

基础知识

在hadoop中 ,NameNode管理元数据,DataNode存储实际数据。
在HBase中,master管理员数据,RegionServer存储实际数据。
元数据定义:描述数据的属性信息,如数据的位置等
HBase优点

  • 跟hadoop MapReduce结合起来非常有利于数据分析
  • 利用hadoop文件系统即便是在普通硬件上也支持水平扩展
  • HBase与Hadoop的其他子项目结合起来能够在数据分析领域创造奇迹。

HBase的组件

  • HFile
  • Region
    • 提供分布式,高可用,以及在HBase集群中对列和列族的存储
    • Region组成了HBase的表。store存储了每个表中的列族
    • AssighmentManager(分配管理)来进行region分配

横向扩展时先添加一个成员到集群中,然后再新添加的节点上启动DataNode和RegionServer进程


HBase的读写过程

  1. 写:client-------->Put/Delete------>RegionServer-------->WAL(Hlog)-------->RegionServer------->Memstore---------->RegionServer--------->client
  2. MemStore-----flush---->HFile

  1. 读:client-------->Get/scan------>任意一个模块直接返回结果

HBase的必备条件和容量规划

  1. 启动并运行hadoop集群
  2. 集群网路和机器必须支持正向和反向的DNS解析
    -【正向解析】通过主机名找到该机器的ip地址
    -【反向解析】通过IP地址找到一台机器的主机名
  3. 集群上的时间必须是同步的
  4. 修改操作系统的相关参数 Nproc:单个用户同一时刻的最大进程数量,Ulimit:单个用户同时打开的最大文件数。在/etc/security/limit.comf中
  5. NTP 、java 、ssh(实现简单服务器到主机的通信) 、linux、 etc/hosts
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值