HBase
小刘同学-很乖
这个作者很懒,什么都没留下…
展开
-
HBase扩展布隆过滤器
HBase在商业项目中的能力每天:消息量:发送和接收的消息数超过60亿将近1000亿条数据的读写高峰期每秒150万左右操作整体读取数据占有约55%,写入占有45%超过2PB的数据,涉及冗余共6PB数据数据每月大概增长300千兆字节。布隆过滤器在日常生活中,包括在设计计算机软件时,我们经常要判断一个元素是否在一个集合中。比如在字处理软件中,需要检查一个英语单词是否拼写正确(也就...原创 2020-07-06 08:36:46 · 244 阅读 · 0 评论 -
HBase 超详细优化
高可用在HBase中Hmaster负责监控RegionServer的生命周期,均衡RegionServer的负载,如果Hmaster挂掉了,那么整个HBase集群将陷入不健康的状态,并且此时的工作状态并不会维持太久。所以HBase支持对Hmaster的高可用配置。关闭HBase集群(如果没有开启则跳过此步)[liujh@hadoop102 hbase]$ bin/stop-hbase.sh...原创 2020-07-03 08:45:32 · 384 阅读 · 0 评论 -
HBase 与Hive的集成详解
HBase与Hive的对比Hive数据仓库Hive的本质其实就相当于将HDFS中已经存储的文件在Mysql中做了一个双射关系,以方便使用HQL去管理查询。用于数据分析、清洗Hive适用于离线的数据分析和清洗,延迟较高。基于HDFS、MapReduceHive存储的数据依旧在DataNode上,编写的HQL语句终将是转换为MapReduce代码执行。HBase数据库是一种面...原创 2020-07-02 08:45:43 · 234 阅读 · 0 评论 -
HBase MapReduce 详解
通过HBase的相关JavaAPI,我们可以实现伴随HBase操作的MapReduce过程,比如使用MapReduce将数据从本地文件系统导入到HBase的表中,比如我们从HBase中读取一些原始数据后使用MapReduce做数据分析。官方HBase-MapReduce查看HBase的MapReduce任务的执行$ bin/hbase mapredcp环境变量的导入执行环境变量的导入...原创 2020-07-01 08:56:36 · 3761 阅读 · 0 评论 -
HBase 详细API操作
环境准备新建项目后在pom.xml中添加依赖:<dependency> <groupId>org.apache.hbase</groupId> <artifactId>hbase-server</artifactId> <version>1.3.1</version></depe...原创 2020-06-30 08:35:46 · 12144 阅读 · 2 评论 -
HBase详细原理
读流程Client先访问zookeeper,从meta表读取region的位置,然后读取meta表中的数据。meta中又存储了用户表的region信息;根据namespace、表名和rowkey在meta表中找到对应的region信息;找到这个region对应的regionserver;查找对应的region;先从MemStore找数据,如果没有,再到BlockCache里面读;B...原创 2020-06-29 08:35:21 · 157 阅读 · 0 评论 -
HBase数据结构详解
RowKey与nosql数据库们一样,RowKey是用来检索记录的主键。访问HBASE table中的行,只有三种方式:通过单个RowKey访问(get)通过RowKey的range(正则)(like)全表扫描(scan)RowKey行键 (RowKey)可以是任意字符串(最大长度是64KB,实际应用中长度一般为 10-100bytes),在HBASE内部,RowKey保存为字节数组。...原创 2020-06-28 08:41:33 · 1352 阅读 · 0 评论 -
HBase Shell详细操作
基本操作进入HBase客户端命令行[liujh@hadoop102 hbase]$ bin/hbase shell查看帮助命令hbase(main):001:0> help查看当前数据库中有哪些表hbase(main):002:0> list表的操作创建表hbase(main):002:0> create 'student','info'...原创 2020-06-26 09:12:57 · 141 阅读 · 0 评论 -
HBase详细安装
Zookeeper正常部署首先保证Zookeeper集群的正常部署,并启动之:[liujh@hadoop102 zookeeper-3.4.10]$ bin/zkServer.sh start[liujh@hadoop103 zookeeper-3.4.10]$ bin/zkServer.sh start[liujh@hadoop104 zookeeper-3.4.10]$ bin/zkS...原创 2020-06-25 08:38:01 · 220 阅读 · 0 评论 -
HBase详细简介
什么是HBaseHBase的原型是Google的BigTable论文,受到了该论文思想的启发,目前作为Hadoop的子项目来开发维护,用于支持结构化的数据存储。官方网站:http://hbase.apache.org– 2006年Google发表BigTable白皮书– 2006年开始开发HBase– 2008年北京成功开奥运会,程序员默默地将HBase弄成了Hadoop的子项目– 2...原创 2020-06-24 08:37:26 · 305 阅读 · 0 评论