摘 要 高性能计算中,硬件支持的多播操作对集合通信的性能具有重要影响.随着超级计算机系统规模的不断扩大,多播组的个数急剧增加,可能会超过硬件支持的多播表条目数,而现有的多播路由算法没有给出相应的解决方案.提出一种面向有限多播表条目数的多播路由算法MR4LMS(multicast routing for limited MFT size),该算法使用先构造后染色、先染色后构造2种多播树构建方法,可显著降低所需的多播表条目数;而在多播表条目数不足时,通过合并算法将多个相似的多播组合并到一起以进一步减少所需的多播表条目数.在多种典型拓扑结构及通信模式下对MR4LMS进行了测试,结果表明仅需设置256个多播表条目就能够支持数千甚至数万个多播组,满足典型应用的需求.还对多播路由算法的最大EFI(edge forwarding index)及运行时间进行了测试,获得了令人满意的结果,表明MR4LMS可用于超大规模互连网络.
关键词 多播路由算法;多播组;有限多播表条目数;集合操作;InfiniBand
多播是一种重要的集合操作,对高性能应用的性能具有重要的影响.它可以通过点对点消息实现,也可以通过专用的硬件实现.相比用点对点消息实现的多播,硬件支持的多播操作具有性能高、CPU占用率低等优点,正受到越来越多的关注.InfiniBand等高速互连网络中,硬件支持的多播操作通过构建多播树实现,树的高度、路由的负载均衡程度等对多播消息的性能具有至关重要的影响.过去的研究中,主要关注于降低树高、提升路由负载均衡程度.
随着超级计算机系统规模的不断扩大,多播组的个数急剧增加,可能会超过硬件支持的多播表(multicast forwarding table, MFT)条目数,而现有的多播路由