Doris 数据副本分区均衡策略，fromBe has no replica in the map, can‘t move

柏油

已于 2022-10-22 12:10:32 修改

阅读量1.4k

点赞数

分类专栏：大数据文章标签： java 运维 apache

于 2022-10-22 09:09:21 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ldw201510803006/article/details/127456962

版权

大数据专栏收录该内容

3 篇文章 0 订阅

订阅专栏

文章目录

前言
一、分区负载均衡
二、问题来了
- 1. 进一步验证
- 2. 解决

前言

当前使用 Doris 版本为 0.14

某天观察到线上 Doris 集群资源使用情况，发现整体上内存、CPU 使用率较低，为降低成本进行了一波缩容操作。

缩容之后，大部分业务都能正常运行，但对于一些大吞吐的查询速度慢了很多，或者根本跑不出来。

在这里插入图片描述

进一步分析发现分区数据分布不均匀，出现的情况是，一部分节点数据多、一部分节点数据少，当查询计划具体分配到 BE 节点体现为部分节点负载高、部分负载低。

在这里插入图片描述

一、分区负载均衡

Doris 默认采用「BeLoad」均衡策略，是按照磁盘负载来均衡数据。在单表来看，可能存在数据无法均衡到每个节点的问题，如：

在这里插入图片描述

官方对副本均衡的解释：

在这里插入图片描述

尝试使用「分区均衡」策略，尽可能将每个表的数据均分到各节点上，官方文档说明：

在这里插入图片描述
FE 参数配置：

在这里插入图片描述

官方文档链接：FE配置、均衡策略

二、问题来了

按照上述文档进行操作后，出现问题：

在这里插入图片描述

排查后发现，分区均衡有个已知 bug，Github#doris#7213 （在高版本中修复）

在这里插入图片描述

大致意思是，如果某个节点上的 SSD 或者 HDD 磁盘没有数据，统计该盘分区副本数量的时候就置为 0，而这个 0 在后期处理的时候直接抛异常，后续操作无法继续进行 …

我看了下，我们目前仅 HDD 盘上有数据，处理到 SSD 就出问题了。

在这里插入图片描述

注：HDD 和 SSD 都是逻辑上的划分，并不一定是你实际使用的磁盘介质，比如你可能只使用了 SSD，Doris 在处理时还是两种都会处理。

1. 进一步验证

对比 debug log （需要手动开启）和 0.14 源码逻辑：

1）debug log：

在这里插入图片描述
2）均衡逻辑片段：

在这里插入图片描述

对比可以发现，确实是已知 bug 导致，它这里是要先把两种介质「待均衡的分区副本」全部找出来，然后再进行迁移。

处理 HDD 是没问题的，到了 SSD 抛了异常，导致整个过程没做任何迁移。

2. 解决

将 Doris 升级到更高版本（1.xx），升级了再考虑分区均衡策略。

Doris 升级至 1.1 之后，采用分区均衡策略，数据已均匀分布，如下：

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

柏油 CSDN认证博客专家 CSDN认证企业博客

码龄8年

576: 原创

4418: 周排名

98万+: 总排名

60万+: 访问

: 等级

1万+: 积分

6689: 粉丝

580: 获赞

172: 评论

1234: 收藏

私信

关注

热门文章

分类专栏

最新评论

redis scan 命令底层原理（为什么会重复扫描？）
柏油: 多谢指正，你说的是正确的，文章处已经修改。
redis scan 命令底层原理（为什么会重复扫描？）
cjay_fighting: 博主写得很好，但感觉有个地方不对，迭代过程中正在进行rehash不会导致数据重复，因为正在rehash时，scan会一次性把游标在dict0的1个槽位和对应扩容后dict1的2个槽位都取出来，而这3个槽位包含了扩容前后所有key。至于定时rehash，也是在主线程轮询中处理的，同一时刻只可能scan和rehash一个发生，否则dict需要做线程安全处理
深入分析redis之listpack，取代ziplist?
im_umu: 意思listpack也能双向遍历？
I/O多路复用模型之 select、poll、epoll
如·月: 使用select的例子中应该要更新maxfd吧，不然新accept的fd收不了消息
redis 6.0之多线程，深入解读
阿......嚏: 1.Redis 6.0之前，多个请求同时执行同一个redis命令是顺序执行？ 2.Redis 6.0之后，命令执行是被主线程顺序执行，但是真正写到客户端是多线程并发执行的？如此理解对不？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

柏油 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。