生命科学探索-HPC并行文件系统解决方案

一、HPC:转化医学的技术保障

    生命科学的进步让人类能够更好地借助科学手段从基础组层面进行分析来指导患者的诊疗工作。相比完成病理分析及少量分子检测后即可实施手术或化疗的传统癌症治疗方案,更加先进的转化医学需要对患者的整个基因组进行分析,以指导药企及临床医生进行更有针对性的药物及治疗方案研究,从而为患者提供更为精准、更加有效的诊疗。转化医学中心工作涉及面广,包含组学技术、生信分析、基础医学研究和药物开发等各个方面。生物信息学研究是转化医学研究的基石,它会涉及对蛋白质、DNA和RNA等生物分子的研究。

    从上述可见,转化医学与数据处理和分析息息相关,包含了生物信息的获取、加工、储存、分配、分析、解释等方方面面。而涉及的数据量庞大:每个文件大小可能达上百GB,例如,仅单个人类全基因组测序分析涉及的数据就可能高达870GB。

    如此体量的数据,就让数据处理速度变得更为关键,而且中心招募的患者通常病情都比较危急,需要以尽可能快的速度基于患者生信数据分析结果给出针对性的创新疗法。

    从医学中心的很多工作来看,都是“与死神赛跑”的过程,而且其加速的过程,或者说效率的提升,都与承载生物信息学研究的IT平台,尤其是强大的高性能计算(HPC)平台密不可分。所以构建一个集存、传、算、用为一体的的定制化平台,能够为转化医学实践提供了坚实可靠的技术基础。

二、超算HPC需要更强存储

    因为算力提升的速度快到令人难以置信,反而让如今的HPC系统开始普遍面临“失衡”的问题,即其计算,与其存储和网络的性能拉开了非常大的差距。任何一个HPC平台的规划都是一个系统性工程,它在体系结构设计、高速互联网络、并行文件系统等任何方面的欠缺或不足,都可能拖累平台的整体性能。如果算力爆棚但存储系统性能不行,就很可能让高算力空转,无法充分释放其价值。

    这种“失衡”,如今在计算和存储间的表现尤为明显——在算法和算力已取得显著提升的今天,不论是机械硬盘,还是固态盘在读写速度和带宽上都已远远跟不上算力的需求,而距离算力单元更近、性能较强且担负热数据承载重任的内存子系统,又很难扩展其容量。

    这可能就是HPC平台算力与存储性能失衡的根因,它会引发“存储墙”或“数据墙”问题,使得算力单元与内存及存储之间就像隔着一堵墙,使其无法得到数据的高效供应,或影响数据高并发访问时的效率。这种传统内存-存储在架构和性能上的瓶颈,会在业务和应用层面造成算力投资的浪费,影响相关应用负载或项目的效率。

三、看StarGFS满足超算存储需求

    通量测序仪的通量飞跃式发展,在数据存储上的需求一直都是水涨船高。最关键的是要进行数据分析,CPU的计算速度很快,但大量时间用在了数据加载上。因此,中间层的存储系统就显得非常重要。

    整个HPC平台需要构建一套更加高性能的存储系统,来更为从容地应对其面临的“存储墙”问题,这就包括要让存储跟上海量数据高速处理的要求、要满足不同科研和临床团队高效并行访问海量生信数据的要求,以及要持续容纳庞大、复杂、多维且不断增长的数据等等。

    推荐采用二级存储模式——面向高性能存储需

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值