- 博客(3)
- 收藏
- 关注
原创 MR的核心思想: 分而治之的思想
注意:不是所有场景用分而治之思想,如果把大问题分多个小问题,小问题之间依赖比较高,比如求平均值的时候。把大问题拆分多个小问题,整合集群资源。
2023-04-19 17:45:54 141 1
原创 zookeeper的三种角色
Observer:可以接受客户端连接,将写请求转发给leader节点,但是不参与投票过程,只同步leader状态,主要存在目的就是为了提高读取效率。Zookeeper 集群中Server有三种角色,Leader、Follower 和 Observer。Follower:用于接收客户端请求并用来返回结果,在选主过程中参与投票。Leader:负责投投票的发起与决议,更新系统状态,写数据。
2023-04-18 17:15:03 1327
原创 分区表和分桶表分别是什么,有什么区别
从作用上来看:分区避免全表扫描,根据分区列查询指定目录提高查询速度, 分桶保存分桶查询结果的分桶结构(数据已经按照分桶字段进行了hash散列)。从建表语句来看:分区表使用partitioned by 子句指定,以指定字段为伪列,需要指定字段类型,分桶表由clustered by 子句指定,指定字段为真实字段,需要指定桶的个数。从表现形是来看:分区是一个目录,分桶是一个文件。
2023-04-18 17:11:51 408 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人