大数据StarRocks(九)：资源隔离实战_starrocks资源组，2024年大数据开发开发陷入饱和,

最新推荐文章于 2024-05-07 10:54:21 发布

2401_84170522

最新推荐文章于 2024-05-07 10:54:21 发布

阅读量878

点赞数 25

分类专栏：程序员文章标签：大数据 java 网络

本文链接：https://blog.csdn.net/2401_84170522/article/details/137727833

版权

程序员专栏收录该内容

30 篇文章 0 订阅

订阅专栏

自 2.2 版本起，StarRocks 支持资源组管理，集群可以通过设置资源组（Resource Group）的方式限制查询对资源的消耗，实现多租户之间的资源隔离与合理利用。在 2.3 版本中，StarRocks 支持限制大查询，集群可以进一步控制大查询对资源的消耗，避免少数的大查询耗尽系统资源，进而影响系统稳定性。StarRocks 2.5 版本支持通过资源组对导入计算进行资源隔离，从而间接控制导入任务对集群资源的消耗。
通过资源隔离功能，您可以将 BE 节点的计算资源划分成若干个资源组，并且为每个资源组关联一个或多个分类器（Classifier）。根据在分类器中设置的条件，系统将匹配查询任务的对应信息。当您发起查询任务时，分类器会根据查询任务的相关信息进行匹配。其中匹配度最高的分类器才会生效，系统则会根据生效的分类器所属的资源组为查询任务分配资源。

资源隔离功能支持计划

基本概念

资源组

通过将 BE 节点划分为若干个资源组 (resource group)，系统在执行相应资源组的查询任务时，会按照为该资源组划分的资源配额（CPU 及内存）分配查询资源。

资源组设置以下资源限制

cpu_core_limit

该资源组在当前 BE 节点可使用的 CPU 核数软上限，实际使用的 CPU 核数会根据节点资源空闲程度按比例弹性伸缩。
取值为正整数。取值范围为 (1, avg_be_cpu_cores]。
** avg_be_cpu_cores 表示所有 BE 的 CPU 核数的平均值。**

说明：
案例一
在 64 核的 BE 节点中设置三个资源组 rg1、rg2、rg3，**cpu_core_limit **分别设置为 8、24、32。
当在该 BE 节点满载时，资源组 rg1、rg2、rg3 能分配到的 CPU 核数分别为
BE 节点总 CPU 核数 ×（8/64）= 48
BE 节点总 CPU 核数 ×（24/64）= 144
BE 节点总 CPU 核数 ×（32/64）= 192

如果当前 BE 节点资源非满载，rg1、rg2 有负载，rg3 无负载，则 rg1、rg2 分配到的 CPU 核数分别为
BE 节点总 CPU 核数 ×（8/32）= 96
BE 节点总 CPU 核数 ×（24/32）= 288

案例二、
在 64 核的 BE 节点中设置三个资源组 rg1、rg2、rg3，**cpu_core_limit **分别设置为 24、48、56。
当在该 BE 节点满载时，资源组 rg1、rg2、rg3 能分配到的 CPU 核数分别为
BE 节点总 CPU 核数 ×（24/128）= 72
BE 节点总 CPU 核数 ×（48/128）= 144
BE 节点总 CPU 核数 ×（56/128）= 168

如果当前 BE 节点资源非满载，rg1、rg2 有负载，rg3 无负载，则 rg1、rg2 分配到的 CPU 核数分别为
BE 节点总 CPU 核数 ×（24/72）= 128
BE 节点总 CPU 核数 ×（48/72）= 256

cpu_core_limit 不能大于BE 的 CPU 核数的平均值，理论上来说超出平均值设置无效，相当于无限制

mem_limit

该资源组在当前 BE 节点可使用于查询的内存（query_pool）占总内存的百分比（%）。取值范围为 (0,1)

concurrency_limit

资源组中并发查询数的上限，用以防止并发查询提交过多而导致的过载。只有大于 0 时才生效，默认值为 0。

大查询限制进一步对资源组进行如下的配置

big_query_cpu_second_limit：

大查询任务可以使用 CPU 的时间上限，其中的并行任务将累加 CPU 使用时间。单位为秒。只有大于 0 时才生效，默认值为 0。

big_query_scan_rows_limit

大查询任务可以扫描的行数上限。只有大于 0 时才生效，默认值为 0。

big_query_mem_limit

大查询任务可以使用的内存上限。单位为 Byte。只有大于 0 时才生效，默认值为 0。

当资源组中运行的查询超过以上大查询限制时，查询将会终止，并返回错误。您也可以在 FE 节点 fe.audit.log 的 ErrorCode 列中查看错误信息。

big_query_mem_limit 和 mem_limit对查询限制的影响

BE节点内存

下面展示将big_query_mem_limit和mem_limit设置不同值对查询的影响

big_query_mem_limit > mem_limit

设置mem_limit=693M，big_query_mem_limit=8G

执行查询时，包内存超限，瓶颈在mem_limit

big_query_mem_limit < mem_limit

设置mem_limit=8G，big_query_mem_limit=693M

执行查询时，包内存超限，瓶颈在big_query_mem_limit

big_query_mem_limit = mem_limit

设置mem_limit=10G，big_query_mem_limit=10240M

执行查询成功

以上实战足以证明mem_limit是基础的内存限制，而big_query_mem_limit是对查询内存进行进一步限制，若big_query_mem_limit和mem_limit相等，big_query_mem_limit设置限制相当于无效；因此big_query_mem_limit小于mem_limit时，对大内存查询进一步限制才有意义。

设置big_query_scan_rows_limit大小对查询的影响

在这里插入图片描述

设置big_query_scan_rows_limit=1000

执行查询时报错误，实际需要扫描12152行的数据，但扫描行数限制1000，所以查询报错。

分类器

可以为每个资源组关联一个或多个分类器。系统将会根据所有分类器中设置的条件，为每个查询任务选择一个匹配度最高的分类器，并根据生效的分类器所属的资源组为该查询任务分配资源。
分类器可以包含以下条件：

user：用户名。
role：用户所属的 Role。
query_type: 查询类型，目前仅支持 SELECT。
source_ip：发起查询的 IP 地址，类型为 CIDR。
db：查询所访问的 Database，可以为 , 分割的字符串。

系统在为查询任务匹配分类器时，查询任务的信息与分类器的条件完全相同，才能视为匹配。如果存在多个分类器的条件与查询任务完全匹配，则需要计算不同分类器的匹配度。其中只有匹配度最高的分类器才会生效。

匹配度的计算方式如下

如果 user 一致，则该分类器匹配度增加 1。
如果 role 一致，则该分类器匹配度增加 1。
如果 query_type 一致，则该分类器匹配度增加 1 + 1/分类器的 query_type 数量。
如果 source_ip 一致，则该分类器匹配度增加 1 + (32 - cidr_prefix)/64。
如果查询的 db 匹配，则匹配度加 10。

例如
多个与查询任务匹配的分类器中，分类器的条件数量越多，则其匹配度越高。

-- 因为分类器 B 的条件数量比 A 多，所以 B 的匹配度比 A 高。
classifier A (user='Alice')
classifier B (user='Alice', source_ip = '192.168.1.0/24')

如果分类器的条件数量相等，则分类器的条件描述越精确，其匹配度越高。

因为分类器 B 限定的 `source_ip` 地址范围更小，所以 B 的匹配度比 A 高。
classifier A (user='Alice', source_ip = '192.168.1.0/16')
classifier B (user='Alice', source_ip = '192.168.1.0/24')

隔离计算资源

开启资源组

通过设置相应会话变量开启 Pipeline 引擎以及资源组功能。

SET enable_pipeline_engine = true;
SET enable_resource_group = true;

说明：如果需要设置全局变量，需要运行 SET GLOBAL enable_resource_group = true;。

创建资源组和分类器

创建资源组，关联分类器，并分配资源。

CREATE RESOURCE GROUP group_name 
TO (
    user='string', 
    role='string', 
    query_type in ('select'), 
    source_ip='cidr'
) -- 创建分类器，多个分类器间用英文逗号（,）分隔。
WITH (
    "cpu\_core\_limit" = "INT",
    "mem\_limit" = "m%",
    "concurrency\_limit" = "INT",
    "type" = "str" -- 资源组的类型，取值为 normal 或 short\_query。
);

示例：

CREATE RESOURCE GROUP rg1
TO 
    (user='rg1\_user1', role='rg1\_role1', query_type in ('select'), source_ip='192.168.x.x/24'),
    (user='rg1\_user2', query_type in ('select'), source_ip='192.168.x.x/24'),
    (user='rg1\_user3', source_ip='192.168.x.x/24'),
    (user='rg1\_user4'),
    (db='db1')
WITH (
    'cpu\_core\_limit' = '10',
    'mem\_limit' = '20%',
    'big\_query\_cpu\_second\_limit' = '100',
    'big\_query\_scan\_rows\_limit' = '100000',
    'big\_query\_mem\_limit' = '1073741824'
);


**自我介绍一下，小编13年上海交大毕业，曾经在小公司待过，也去过华为、OPPO等大厂，18年进入阿里一直到现在。**

**深知大多数大数据工程师，想要提升技能，往往是自己摸索成长或者是报班学习，但对于培训机构动则几千的学费，着实压力不小。自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！**

**因此收集整理了一份《2024年大数据全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。**
![img](https://img-blog.csdnimg.cn/img_convert/9ccfcc52b743aaa0fabc1081a23b3639.png)
![img](https://img-blog.csdnimg.cn/img_convert/404bb49b70fe3375b15ce5204e6db75c.png)
![img](https://img-blog.csdnimg.cn/img_convert/a947d97e8dbd2b0c096f90fa0c43d94a.png)
![img](https://img-blog.csdnimg.cn/img_convert/627d40441b11937b5563d9af39b4202c.png)
![img](https://img-blog.csdnimg.cn/img_convert/f82a40f4a379da56ab5b1cfd7fc2a85a.png)

**既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，基本涵盖了95%以上大数据开发知识点，真正体系化！**

**由于文件比较大，这里只是将部分目录大纲截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频，并且后续会持续更新**

**如果你觉得这些内容对你有帮助，可以添加VX：vip204888 （备注大数据获取）**
![img](https://img-blog.csdnimg.cn/img_convert/bd6211e3c1dced5c3b39ced52430e4fd.png)

**一个人可以走的很快，但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎扫码加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！**

正体系化！**

**由于文件比较大，这里只是将部分目录大纲截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频，并且后续会持续更新**

**如果你觉得这些内容对你有帮助，可以添加VX：vip204888 （备注大数据获取）**
[外链图片转存中...(img-Rpn4UiIr-1713020040715)]

**一个人可以走的很快，但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎扫码加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！**

2401_84170522

关注

25
点赞
踩
28

收藏

觉得还不错? 一键收藏
0
评论
大数据StarRocks(九)：资源隔离实战_starrocks资源组，2024年大数据开发开发陷入饱和,

自 2.2 版本起，StarRocks 支持资源组管理，集群可以通过设置资源组（Resource Group）的方式限制查询对资源的消耗，实现多租户之间的资源隔离与合理利用。在 2.3 版本中，StarRocks 支持限制大查询，集群可以进一步控制大查询对资源的消耗，避免少数的大查询耗尽系统资源，进而影响系统稳定性。StarRocks 2.5 版本支持通过资源组对导入计算进行资源隔离，从而间接控制导入任务对集群资源的消耗。
复制链接

扫一扫