达梦DM8 MPP集群搭建

一、DM MPP集群简介

达梦大规模并行处理 MPP(DM Massively Parallel Processing,缩写 DM MPP)是基于达梦数据库管理系统研发的完全对等无共享式集群组件,支持将多个DM 数据库实例组织为一个并行计算网络,对外提供统一的数据库服务,以极低的成本代价,为客户提供高性能计算。
DM MPP采用的完全对等无共享体系架构,结合了完全无共享体系的优点,不采用增加主控制节点来协调所有并行处理的主从式方法,而是各个节点完全对等,简化了体系的实现,也消除了系统可能存在的主节点瓶颈问题。
在这里插入图片描述
DM MPP 系统架构图
DM MPP系统内每个EP只负责自身部分数据的读写,执行计划在所有EP并行执行,能充分利用各EP的计算能力及发挥各EP独立存储的优势。数据只在必要时通过DM的高速邮件MAL系统在EP间传递。

二、MPP搭建

1、实验环境:

虚拟机软件:VirtualBox 6.1
数据库:DM8 64位,安装包名称为dm8_setup_rh7_64_ent_8.1.1.88.iso 
主机操作系统:CentOS Linux release 7.2.1511 (Core),64位

2、资源规划
配置一个三节点MPP。三个节点都配置两块网卡,一块接入内部网络交换模块,一块接入到外部交换机。三节点实例名分别为EP0、EP1和EP2,相关的IP、端口等规划见下表。
在这里插入图片描述
3.配置 dm.ini
EP0实例的dm.ini的以下几个参数修改如下

INSTANCE_NAME = EP0
PORT_NUM = 5236 
MAL_INI = 1 
MPP_INI = 1

EP1实例的dm.ini的以下几个参数修改如下
INSTANCE_NAME = EP1
PORT_NUM = 5237
MAL_INI = 1
MPP_INI = 1

EP2实例的dm.ini的以下几个参数修改如下

INSTANCE_NAME = EP2
PORT_NUM = 5238 
MAL_INI = 1 
MPP_INI = 1

4.配置 dmmal.ini
为3个EP 配置 dmmal.ini如下,配置完全一样:

[MAL_INST1]
MAL_INST_NAME = EP0
MAL_HOST = 10.0.3.106
MAL_PORT = 5269
MAL_INST_HOST = 192.168.56.106
MAL_INST_PORT = 5236

[MAL_INST2]
MAL_INST_NAME = EP1
MAL_HOST = 10.0.3.107
MAL_PORT = 5270
MAL_INST_HOST = 192.168.56.107
MAL_INST_PORT = 5237

[MAL_INST3]
MAL_INST_NAME = EP2
MAL_HOST = 10.0.3.108
MAL_PORT = 5271
MAL_INST_HOST = 192.168.56.108
MAL_INST_PORT = 5238

5.配置 dmmpp.ctl
dmmpp.ctl 是一个二进制文件,用户不能直接配置,需要先配置 dmmpp.ini。
配置 dmmpp.ini 如下:

[SERVICE_NAME1] 
MPP_SEQ_NO = 0 
MPP_INST_NAME = EP0
[SERVICE_NAME2] 
MPP_SEQ_NO = 1 
MPP_INST_NAME = EP1
[SERVICE_NAME3] 
MPP_SEQ_NO = 2
MPP_INST_NAME = EP2

使用 DM 提供的工具 dmctlcvt 将 dmmpp.ini 转换成 dmmpp.ctl

./dmctlcvt type=2 SRC=/dm8/data/DAMENG/dmmpp.ini DEST=/dm8/data/DAMENG/dmmpp.ctl

将生成的dmmpp.ctl 拷贝至其它2个EP,保证MPP系统中所有EP的dmmpp.ctl完全相同。
6、运行MPP
分别启动 EP0、EP1和 EP2数据库实例,MPP系统即能正常运行,用户就可以登录任一EP进行数据库操作。
登录后查看到的各EP节点状态:
在这里插入图片描述
登录节点序号:
在这里插入图片描述
7.建立分布表
创建一个哈希分布表

CREATE TABLE T1(C1 INT,C2 INT,C3 INT,C4 VARCHAR(10)) DISTRIBUTED BY HASH(C1); 
DECLARE 
i INT; 
BEGIN 
FOR i IN 1..1000 LOOP 
INSERT INTO T1 VALUES (i,i+1,i+2,'adasf'); 
END LOOP; 
END; 
/ 
COMMIT;

查看数据在各节点分布情况:
在这里插入图片描述
查看某一节点存储的表中的数据:
在这里插入图片描述
8.停止 MPP 系统
需要停止MPP系统的运行时,只需要停止每个EP的DM 实例即可。
若在 DM MPP 系统的运行过程中,某一 EP 发生故障停机,则整个MPP系统将处于不能正常服务的状态。当前所有的用户会话会被系统断开,不能进行全局登录,只能进行本地登 录。

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 11
    评论
### 回答1: MPP(Massively Parallel Processing)集群是一种高性能计算集群,旨在处理大规模数据集和复杂查询。MPP集群通常由数百个或数千个节点组成,每个节点都具有自己的处理器、内存和存储资源。这些节点通过高速网络相互连接,形成一个分布式计算环境。 MPP集群的主要特点包括: 1. 并行处理:MPP集群可以将任务分配给不同的节点,并并行处理多个查询或作业。这可以大大缩短处理时间,并提高性能和吞吐量。 2. 高可用性:由于MPP集群中的节点数量众多,因此即使出现节点故障或其他故障,整个集群也可以继续运行,保证高可用性和可靠性。 3. 可扩展性:MPP集群可以根据需要增加节点数量,以扩展计算和存储能力。这使得它们非常适合大规模数据分析和处理任务。 4. 复杂查询支持:MPP集群支持处理复杂的SQL查询,包括联合、聚合、窗口函数等。 5. 数据分和分布式存储:MPP集群可以将数据分存储在不同的节点上,以实现更快的查询和更高的性能。此外,MPP集群通常使用分布式存储系统,如Hadoop HDFS、Amazon S3等,来存储和管理数据。 总之,MPP集群是一种强大的计算环境,可用于处理大规模数据集和复杂查询。它们通常用于数据仓库、商业智能、大数据分析等领域。 ### 回答2: mpp集群(Massively Parallel Processing Cluster,大规模并行处理集群)是一种通过将数据和计算任务在多台计算机上并行执行来实现高性能数据处理和分析的技术。 mpp集群的特点包括: 1. 可扩展性:mpp集群由多台计算机组成,可根据需求自由扩展集群规模。通过添加更多的计算节点,可以有效地处理更大规模的数据和更复杂的计算任务。 2. 并行计算:mpp集群将大规模的数据和计算任务分解为多个小任务,并且在多台计算机上并行执行。这种并行计算能够大大加速数据处理和分析的速度,提高系统的吞吐量。 3. 数据分布和负载均衡:mpp集群将数据划分为多个分,并将这些分分配给不同的计算节点。这样可以在数据处理过程中实现负载均衡,确保每个计算节点的负载相对均衡,避免出现热点节点和性能瓶颈。 4. 高可用性:通过在mpp集群中使用冗余计算节点和数据备份策略,可以提供高可用性。即使其中某个计算节点或数据存储发生故障,系统仍然可以继续正常运行,不会发生数据丢失或服务中断。 5. 并行存储和访问:mpp集群通常采用分布式文件系统或分布式存储系统来支持并行存储和访问。这些系统可以将大规模的数据存储在多个计算节点上,并通过并行读取和写入操作来实现高效的数据访问。 mpp集群广泛应用于大数据分析、数据仓库、商业智能等领域,能够满足处理海量数据和复杂计算任务的需求,提供高性能和可扩展的数据处理解决方案。 ### 回答3: MPP(Massively Parallel Processing)集群是一种并行计算架构,主要用于处理大规模数据和复杂计算任务。它由多个计算节点组成,每个节点都具有独立的计算和存储资源,节点之间通过高速网络进行通信。 在MPP集群中,数据通常被分割成多个分,并存储在各个节点上。每个节点都可以并行处理自己的分数据,这样就能够同时执行多个任务,大大提高了计算效率。节点之间还可以相互传递数据和计算结果,实现数据的交互与共享。 MPP集群具有以下特点: 1. 可伸缩性:MPP集群的规模可以根据需求进行扩展,添加更多的节点,以处理更大规模的数据和更复杂的计算任务。 2. 高性能:由于每个节点都具有独立的计算资源,并且能够并行处理任务,MPP集群能够以高效的方式执行计算,提供较低的响应时间和更高的吞吐量。 3. 高可用性:MPP集群通常采用冗余设计,即多个节点之间可以互相备份和恢复数据,当某个节点失败时,其他节点可以接替其工作,保证系统的可靠性和持续运行。 4. 灵活性:MPP集群支持多种数据处理和分析方式,例如数据存储、数据查询、数据挖掘和机器学习等。同时,它也能够与其他大数据技术如Hadoop和Spark等进行集成,共同构建复杂的数据处理解决方案。 MPP集群在大数据领域中应用广泛,特别适用于需要高性能计算和处理大规模数据的场景,如金融风险管理、科学研究、电信分析和电子商务等。通过充分利用MPP集群的并行计算能力,可以更快速、高效地处理和分析大量的数据,帮助企业做出更明智的决策和发现更有价值的信息。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值