mysql 高并发 集群架构_一种高并发的GPU集群架构及其负载均衡方法技术

【技术实现步骤摘要】

一种高并发的GPU集群架构及其负载均衡方法

本专利技术属于GPU集群架构及其负载均衡方法

,特别是涉及一种高并发的GPU集群架构及其负载均衡方法。

技术介绍

GPU因其高性能的并行计算能力而被广泛用于分布式集群中的并行计算。在高并发的集群中多采用CPU+GPU混合计算节点;在CPU+GPU混合计算节点中的CPU与GPU有多种组合方式:单CPU与多GPU组合、单CPU与单GPU组合、多CPU与多GPU组合。GPU集群的计算和运行效率取决于GPU集群的架构以及对GPU集群中运算节点的利用。为实现GPU集群计算和运行的高效率,本专利技术致力于专利技术一种高并发的GPU集群架构,以解决GPU集群架构不合理以及负载均衡方法差导致的GPU集群运行和计算的效率低的问题。

技术实现思路

本专利技术的目的在于提供一种高并发的GPU集群架构及其负载均衡方法,通过GPU集群架构的任务分布节点对计算节点的负载均衡,实现了GPU集群的优化和对计算节点的负载均衡,解决了现有的GPU集群架构不合理以及负载均衡方法差导致GPU集群运行和计算效率低的问题。为解决上述技术问题,本专利技术是通过以下技术方案实现的:本专利技术为一种高并发的GPU集群架构及其负载均衡方法,包括任务分布节点、若干计算节点;所述计算节点间采用分布式计算方式;所述计算节点包含若干CPU和若干GPU;所述计算节点内采用异构架构;所述节点包含若干设备;所述设备包含节点内全部所述CPU或任一所述GPU;所述计算节点内CPU共享存储器;所述计算节点内GPU独享其内DRAM;所述计算节点内GPU与CPU共享存储器。优选地,所述任务分布节点与计算节点、计算节点间均采用MPI消息通信;所述任务分布节点内存储作业列表;所述作业列表包含当前作业类型、计算量需求、存储量需求、网络需求。优选地,所述异构架构采用CPU线程或CPU进程调度GPU的运行方式。优选地,若所述计算节点内只包含单核CPU与若干GPU连接,则所述CPU进行逻辑和事务串行计算;所述GPU进行并行计算;若所述计算节点内包含多核CPU与若干GPU连接;则所述CPU进行逻辑和事务串行计算、并行计算;所述GPU进行并行计算。优选地,所述CPU采用MPI进程、pThread线程控制CPU核并行计算;所述GPU采用CUDA或OpenCL编程控制GPU众核并行计算。一种高并发的GPU集群架构的负载均衡方法,步骤如下:S00:GPU集群中任务分布节点获取作业列表中的当前作业;S01:任务分布节点分析计算量需求、存储量需求、网络需求;S02:任务分布节点根据节点信息列表匹配当前作业至计算节点;S03:任务分布节点根据计算节点定时反馈更新节点信息列表。优选地,所述节点信息列表包括节点IP、CPU利用率、进程数量、GPU利用率、剩余存储空间。优选地,所述任务分布节点根据节点信息列表匹配当前作业至计算节点的步骤如下:所述任务分布节点根据节点信息列表判断是否存在空闲节点,若存在,则任务分布节点有限匹配当前作业至计算节点,若不存在,则任务分布节点从满足计算需求、存储需求、网络需求的计算节点中选择GPU利用率最低的计算节点。本专利技术具有以下有益效果:本专利技术通过GPU集群架构的任务分布节点对计算节点的负载均衡,实现了GPU集群的优化和对计算节点的负载均衡,解决了现有的GPU集群架构不合理以及负载均衡方法差导致GPU集群运行和计算效率低的问题,优化了GPU集群架构,提高了GPU集群的负载均衡方法和GPU计算节点的计算效率。当然,实施本专利技术的任一产品并不一定需要同时达到以上所述的所有优点。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术的一种高并发的GPU集群架构结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。请参阅图1所示,本专利技术为一种高并发的GPU集群架构及其负载均衡方法,包括任务分布节点、计算节点;计算节点间采用分布式计算方式;计算节点包含若干CPU和若干GPU;计算节点内采用异构架构;节点包含若干设备;设备包含节点内全部CPU或任一GPU;计算节点内CPU共享存储器;计算节点内GPU独享其内DRAM;计算节点内GPU与CPU共享存储器。其中,任务分布节点与计算节点、计算节点间均采用MPI消息通信;任务分布节点内存储作业列表;作业列表包含当前作业类型、计算量需求、存储量需求、网络需求。其中,异构架构采用CPU线程或CPU进程调度GPU的运行方式。其中,若计算节点内只包含单核CPU与若干GPU连接,则CPU进行逻辑和事务串行计算;GPU进行并行计算;若计算节点内包含多核CPU与若干GPU连接;则CPU进行逻辑和事务串行计算、并行计算;GPU进行并行计算。其中,CPU采用MPI进程、pThread线程控制CPU核并行计算;GPU采用CUDA或OpenCL编程控制GPU众核并行计算。一种高并发的GPU集群架构的负载均衡方法,步骤如下:S00:GPU集群中任务分布节点获取作业列表中的当前作业;S01:任务分布节点分析计算量需求、存储量需求、网络需求;S02:任务分布节点根据节点信息列表匹配当前作业至计算节点;S03:任务分布节点根据计算节点定时反馈更新节点信息列表。其中,节点信息列表包括节点IP、CPU利用率、进程数量、GPU利用率、剩余存储空间。其中,任务分布节点根据节点信息列表匹配当前作业至计算节点的步骤如下:任务分布节点根据节点信息列表判断是否存在空闲节点,若存在,则任务分布节点有限匹配当前作业至计算节点,若不存在,则任务分布节点从满足计算需求、存储需求、网络需求的计算节点中选择GPU利用率最低的计算节点。值得注意的是,上述系统实施例中,所包括的各个单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本专利技术的保护范围。另外,本领域普通技术人员可以理解实现上述各实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,相应的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘或光盘等。以上公开的本专利技术优选实施例只是用于帮助阐述本专利技术。优选实施例并没有详尽叙述所有的细节,也不限制该专利技术仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本专利技术的原理和实际应用,从而使所属

技术人员能很好地理解和利用本专利技术。本专利技术仅受权利要求书及其全部范围和等效物的限制。本文档来自技高网...

6850192.gif

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
由于内存数据库具有比基于磁盘的数据库更高的查询响应速度和并发度,其被广泛应用于银行、证券交易所和在线购物等数据量庞大并且实时性要求高的商业领域。索引能够有效降低数据的搜索空间、提高内存数据库的查询效率,然而当前它却受到性能和效率的挑战。 基于图形处理器的通用计算(GPGPU)在多个领域具有重要的研究价值和应用前景,也是当前研究的热点。目前图形处理器(GPU)上索引技术的研究已有一定的相关成果,然而这些研究成果存在着诸如:并行算法未充分利用硬件的资源、并行度不高,算法缺乏可扩展性且不能解决索引数据的更新等问题。因此,本文以如何充分利用 GPU 的硬件资源、最大限度地提高内存数据库索引的操作性能为主要研究内容,在相关研究的基础上,本文主要做了以下工作: 1. 对目前内存数据库索引技术的研究成果进行总结归纳,并且对 GPU 的硬件特点和编程技术做了相关综述。 2. 提出一种基于 GPU T-树索引的并行计算方案,该方案通过分析 T-树的节点间的父子关系,在 GPU 上实现对 T-树的最大并行度构建。设计在 GPU 上 T-树索引数据可任意伸缩的动态数组,解决 GPU 上尚无动态分配显存空间的问题;通过对各种构建 T-树方案的理论和实验分析,提出的并行建树方案较传统的建树方案,在操作效率和空间利用率上均有明显的性能优势。为解决 CUDA 程序数据传输的瓶颈问题,通过页锁定内存的方式提高 CPU 和 GPU 间的数据传输速率;为适应未来硬件发展的需求,对算法的可扩展性进行相关研究;为验证方案的正确性,提出基于 GPU T-树的遍历算法; 为验证提出的并行方案的有效性,进行相关的实验论证。 3. 为加速多维数据的操作性能,提出一种基于 GPU 多维线性哈希索引的并行处理方案。该方案通过对传统哈希索引数据结构的扩展,利用 2 层的数据结构可实现哈希表在 GPU 上的任意收缩,从而解决多维数据在 GPU 上无法有效更新的问题。在哈希表的记录并行批量插入算法中,采用并行分裂哈希桶的方式可加速哈希表分裂的处理 速度,从而提高了插入的效率;设计一个灵活的溢出桶管理机制,可提高多维哈希索引在 GPU 上的存储空间利用率;对提出的记录并行批量插入方案进行算法时间和空间复杂度的分析,并与传统的 CPU 算法进行相关对比;在各种硬件平台上对多维线性哈希索引记录的并行批量插入、批量删除和查询的操作性能进行相关的实验论证。 4. 提出一种基于 GPU 缓存敏感 CSB+-树索引的无锁并行处理方案,该方案通过对传统的 CSB+-树的结构改进,可实现 CSB+-树的索引数据在 GPU 上动态更新。在 GPU上提出基于树层和基于节点索引键 CSB+-树两种并行构建算法,其中后者可实现对CSB+-树的最大并行度构建;通过在 CSB+-树的内部节点添加填充位的方式,可减少GPU 线程块里的线程分支数,从而提高 CSB+-树的查询性能;通过对 CSB+-树的查询算法使用共享存储器的可行性分析,指出传统的缓存敏感技术的思想在复杂的 GPU 内存框架中并不适合使用。为验证提出的并行方案的有效性,在多个硬件平台上进行相关的实验论证。 5.在 GPU 平台上提出一种 BD-树索引的并行计算方案,该方案通过修改传统 BD-树的哈希函数,可实现对 BD-树索引的并行处理。通过对传统 BD-树的数据结构改进,可实现 BD-树索引数据在 GPU 上的更新操作;通过分析 BD-树的树形结构,可实现基于内部节点键的并行度方式构建 BD-树;通过增加额外的空间开销,减少 GPU 原子函数的调用次数,可显著提高 BD-树哈希表的数据插入效率;对 BD-树并行构建算法进行空间复杂度的分析,与传统的构建算法相比,提出算法的空间利用率明显得到提高。同样,为验证提出方案的有效性,进行相关的实验论证。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值