使用北鲲云在AWS上运行基因分析HPC任务

北鲲云_beikun

于 2022-11-16 14:03:12 发布

阅读量576

点赞数 1

分类专栏：云计算文章标签： aws 云计算基因分析

本文链接：https://blog.csdn.net/Cloudam/article/details/127883805

版权

本文介绍了如何利用北鲲云平台在AWS上执行基因分析的高性能计算（HPC）任务。用户需准备S3 bucket以存放输入和输出文件，并在北鲲云控制台上完成 Workspace 和集群的创建。通过配置AWS AK/SK，用户可以在集群登录节点上提交作业脚本，执行基因分析任务。任务完成后，结果将自动保存到S3，EC2实例会被销毁，实现成本有效控制。

摘要由CSDN通过智能技术生成

背景

  近三十年来，生命科学与计算科学飞速发展。生物信息学是一门生命科学与计算科学的前沿交叉学科。生物信息学产生和迅猛发展的主要推动力来自于新一代测序等高通量技术在生命科学领域越来越广泛的应用。 基因组学是这一趋势的一个主要例子，其中高通量下一代测序 (NGS) 设备被用于对 DNA、mRNA、调控区域、肠道微生物组等进行测序。计算工作流程也在快速开发和标准化，并且支持动态进行扩展。随着大量基因组数据的收集，处理时间通常在数十亿核心小时的数量级，处理成本也相应增加。因此，客户正在寻找运行时间最短、成本最低的优化工具和系统。通常清况下有2种方式可供选择。 第一种是建设本地计算集群。一方面建设本地大型计算集群成本昂贵，同时峰值负载的能力有限，项目的周期也相对较长，前期成本投入很大。第二种是构筑云上的HPC平台。利用云资源可以快速构建云上HPC平台，云上还提供了最新技术和资源的快速访问，包括最新加速卡或减少计算所需时间的最新一代处理器。通过选择合适的实例类型，可以缩短总体计算时间。

在这篇博文中，我们将展示如何利用北鲲云HPC平台在AWS运行运行基因分析HPC任务。

概述

本指南将向您展示如何通过北鲲云控制台启动基于Amazon EC2构建的slurm集群，该集群提供有一个登录节点，您可以在此节点上通过简单配置结合AWS S3存储快速投递多个基因分析任务。

前置条件

在开始使用北鲲云平台之前您需要做下面准备：

1.拥有访问指定S3 bucket权限的1对AWS AK/SK。

2.用于存放计算输入文件的S3 bucket。

3.用于存放计算结果文件的S3 bucket,也可以使用输入文件bucket的不同目录作为区分。

您可以通过AWS S3控制台来快速创建S3 bucket并上传输入文件，如果已有bucket可跳过此

最低0.47元/天解锁文章

北鲲云_beikun

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
使用北鲲云在AWS上运行基因分析HPC任务

您需要选择数据存放相同的地域创建Workspace，选择相同地域的好处是数据在AWS EC2上和S3之间上传下载可以使用内网进行访问，速度更快而且更加安全。Workspace是北鲲云为您在AWS上创建的一片虚拟空间，对应了AWS的某个region，后续使用的AWS相关服务和资源都在这个region下进行配置。在这篇博文中，我们演示了如何使用北鲲云平台在AWS来提交基因分析任务。特别申明：北鲲云不会在未经用户授权的情况下访问用户的EC2，也不会获取用户的数据，用户在使用平台前需要签署电子版法律协议。
复制链接

扫一扫

专栏目录