生物信息学软件_基因测序、生物信息分析平台工作站硬件配置探讨2020

本文探讨了生物信息学的计算特点,包括全基因组数据分析流程,强调了序列组装和比对计算在硬件需求上的差异。对于大型基因组装,需要大量内存,如150G以上;而对于比对,多核CPU更为关键。推荐配置考虑因素包括CPU核数、内存容量和I/O带宽,适合处理高通量测序数据的分析任务。
摘要由CSDN通过智能技术生成

一)(一)了解生物信息学

df4cbcf51c007f6b81744cab5b932bc0.png


生物信息学(Bioinformatics)利用应用数学、信息学、统计学和计算机科学的方法研究生物学的问题。生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是计算机,研究方法包括对生物学数据的搜索(收集和筛选)、处理(编辑、整理、管理和显示)及利用(计算、模拟)。生物信息学典型工作流程

8465631ec07ee3b8ad4c5773e6279918.png


这个过程是由一系列链接的步骤组成,这些步骤将原始输入(测序原始数据RAW)转换为有意义或可解释的输出,例如,高通量测序NGS数据而生成的fastq文件。然后用于基因组序列分析的特定功能方面的特定工具执行。根据执行的分析类型,工作流可以具有可变数量的步骤,因此可以是简单的或复杂的。
生物信息学主要研究方向:DNA/RNA/蛋白质测序,序列比对,基因发现,基因组组装,药物设计,药物发现,蛋白质结构比对和预测,通过使用计算密集型技术(用于模式识别,数据挖掘,机器学习算法和可视化)来加深对生物过程的理解。因此需要配备先进的计算设备和丰富专业的分析软件
(二)生物信息学分析的计算特点
如何选购一个理想的图形工作站硬件配置,可能很多人思考过:
什么是用于生物信息学和计算生物学研究的最佳PC/工作站?
用于生物信息学分析的服务器配置
全基因组序列分析实验室的硬件配置
高通量序列分析服务器有什么要求
下一代测序数据分析硬件配置推荐
用于分析NGS宏基因组学数据的计算机配置?
2.1 生物信息分析的计算特点
生物信息数据分析涉及到基因组学、转录组学、蛋白质组学、宏基因组学、代谢物组学等,下图是全基因组数据分析流程

27bf55b234519ac87518d37f6197637f.png


生物信息学数据分析所涉及的计算主要是De novo的序列组装计算(Assembly)、重测序过程中的序列/映射比对计算(Mapping)
序列组装计算分析:
如果要进行从头组装(例如Velvet),假设一个人的全基因组测序数据,采用二代测序的方法,人的基因组3G,10倍数据30G,那么这30G的碱基,在切成更小的kmer,假设数据增加到了100G,还不算存储序列的一些其他信息,序列拼接的时候必须一次将所有数据同时存入内存,如果内存达不到100G,拼接根本无法完成。
因此,对于大型基因组装而言,需要的硬件资源特别多,不紧cpu要有足够的计算能力,内存在150G以上,但是如细菌基因组,数据集和基因组数据量不太大,内存128GB足够了
序列比对计算分析:
对于使用BWA/Bowtie等程序进行映射读取,对内存RAM要求不高(例如32GB即可),但CPU内核数量(及其频率)将决定计算过程需要多长时间。如果要进行大量对齐和比对(例如使用BWA),那么拥有大量CPU核心比拥有大量内存更为重要。
当然配置规格取决于您的预算和计划进行的分析类型。
RNASeq中计算量较大的就是比对步骤了,而比对往往只需要一次就可以! 一般32核CPU+64GB RAM硬件配置,可以满足对基因组/转录组/虹基因组分析的标准映射(maping)以及下游分析。
为了使NGS(下一代测序)分析的工作负荷最大化,硬件配置三个关键瓶颈:可用的CPU核数、内存容量以及I/O带宽
2.2 生信分析对硬件配置要求
如何处理454和Illumina数据? 全基因组装配/组装?序列拼接?映射读取到参考基因组?
(1)需要多少存储空间才能保持数据实时读取(硬盘容量)?
开发下一代测序(高通量测序)的临床应用的瓶颈是存储和分析所生成的大量数据。应用程序多种多样,但共同的主题在计算和分析上具有挑战性。
(2)要分析的每个文件有多大(RAM容量,硬盘读写速度)?
(3)要使用的软件准备好使用多处理器运行时间是否有要求(CPU核数)?
配置参考:
(1)基于基因组计划的大小

0f9b481eed0168f45846de1092584fbd.png

(2)基于课题组研究人员数量

d4863c5c54cc63a88b2803e864e8c4b7.png

(三)生物信息学分析的硬件配置推荐

1828dcd7fd8cc20a2420d14ae953c115.png

85beb7bac50b0cad537d070dc6f3b137.png

上述所有配置,代表最新硬件架构,可提供测试,欢迎交流。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值