1、把过滤器内置到hbase底层,只有通过过滤的数据才进入上面的流程,如果有大量的数据被过滤掉,能减少大量的io(我们能节约10几倍,性能提升了10几倍)。
2、充分使用上下行带宽,提升数据之间的同步数据(索引在多个机房创建,创建完成之后,机房之前相互同步)。
3、使用p2p同步模式,提升数据同步速度。
分布式建库(索引)优化
最新推荐文章于 2021-08-05 17:28:58 发布
1、把过滤器内置到hbase底层,只有通过过滤的数据才进入上面的流程,如果有大量的数据被过滤掉,能减少大量的io(我们能节约10几倍,性能提升了10几倍)。
2、充分使用上下行带宽,提升数据之间的同步数据(索引在多个机房创建,创建完成之后,机房之前相互同步)。
3、使用p2p同步模式,提升数据同步速度。