Hbase—RegionSplit
Region分裂策略
我们刚建立表的时候只有一个Region,随着我们表中的数据量不断的增长,我们的Region会逐渐的分裂,相当于一个Region,变成了两个Region,之前的Region就没了,那么,这个Region什么时候进行分裂呢?
Region分裂过程
Region分裂完毕之后,尽可能的会让两个Region分裂的数据相同,这里提一个词汇预分区,它也会Split,分裂的细节只这样的,它生成两个新的Region,那么相当于在HDFS上相当于有什么呢?是不是会有两个新的路径?每一个Region在HDFS上体现出来的是一个路径,Region下面是有Store的,Store下面会有StoreFile的,那么我一个Region生成两个新的Region肯定是生成两个新的路径,将之前的数据,分成两半。
那么我在生成新路径的时候,是不是需要的时间会比较久呢?因为毕竟涉及到了数据的移动了,它不是直接将数据分开