Hbase
文章平均质量分 92
程序员劝退师丶
有道无术,术尚可求也,有术无道,止于术
展开
-
HBase系列(二) 高级篇
预分区:请求数据的负载均衡的分发到每台regionserver。不要负载过高1.一定要短2.散列原则–实现负载均衡如果Rowkey是按时间戳的方式递增,不要将时间放在二进制码的前面,建议将Rowkey的高位作为散列字段,由程序循环生成,低位放时间字段,这样将提高数据均衡分布在每个Regionserver实现负载均衡的几率。如果没有散列字段,首字段直接是时间信息将产生所有新数据都在一个 RegionServer上堆积的热点现象,这样在做数据检索的时候负载将会集中在个别RegionServer,降低查询效率原创 2022-06-13 15:21:35 · 246 阅读 · 0 评论 -
HBase系列(一)
Apache HBase是面向列的数据存储,开源的分布式的多版本的非关系型数据库(依赖谷歌bigtable论文) HBase的全称是Hadoop Database,是一个高可靠性,高性能、面向列、可伸缩、实时读写的分布式数据库。利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理HBase中的海量数据,利用Zookeeper作为其分布式协同服务。主要用来存储非结构化和半结构化数据的松散数据(列存NoSQL数据库)。注意:NoSQL的全称是Not Only SQL,泛指非原创 2022-06-10 16:16:12 · 347 阅读 · 0 评论