HBase
大数据核心技术之分布式数据库HBase技术共享、笔记。
菜鸟周星星
大数据开发攻城狮。更多学习和面试资料尽在微信公众号:Hadoop大数据开发
展开
-
深入Hbase原理(超详细)
目录Hbase概述Hbase中的核心概念原理加强之Region拆分HMaster的作用 主节点Region的拆分负载均衡1.1 自动负载均衡流程1.2 强制执行负载均衡1.3 人为的移动大小合并大合并之Region合并小合并之Hfile的合并Hbase的数据导入3.1shell端脚本方式使用步骤3.2Java程序方式MR程序读取数据处理 并输出到Hbase中二级索引的设计及协处理器Hbase概述我们都知道,Hbase是一个..原创 2020-11-29 16:01:02 · 996 阅读 · 2 评论 -
你不知道的查找算法之布隆过滤器
目录布隆过滤器简述缘何要使用布隆过滤器抛砖引玉布隆过滤器原理预热知识之哈希函数布隆过滤器的核心原理布隆过滤器特点布隆过滤器本质布隆过滤器使用条件HBase读取数据之布隆过滤器面试题之布隆过滤器具体的实现过程:布隆过滤器简述布隆过滤器(Bloom Filter)是1970年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都比一般的算法要好的多,缺点是有原创 2020-11-26 19:37:38 · 483 阅读 · 0 评论 -
JAVA连接HBase客户端及HBase写入数据和读取数据原理解析
JAVA连接HBase客户端接着上篇文章进行代码的实践,从JAVA 客户端对 HBase的客户端进行一系列操作工具类:HbaseUtil静态代码块一次性创建连接对象 并赋值返回连接对象 ConnectionTable对象的创建Admin对象的创建数据的展示package cn._doit19.hbase.utils;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.hba.原创 2020-11-26 15:52:22 · 1817 阅读 · 0 评论 -
HBase的基础概念及shell端命令和java api操作客户端
HBase概述Hbase简述Hbase是一个高可靠性的、可性能的(查询快,通过key取数据块,算法,索引,缓存),面向列的可伸缩性的分布式数据库系统。HBase特点1.可存储海量数据 -------借助HDFS2.高扩展性-------存储能力、运算能力 使用廉价机器的横向扩展3.分布式 数据库系统 解决高并发访问的问题4.列式存储数据: 在物理存储上,hbase的数据是按照列族分开存储的K V对的字节数组,在对应的hdfs中,一张表对应一个文件夹,在对应的hd...原创 2020-11-24 23:39:03 · 262 阅读 · 0 评论