网络蛋白质组学在计算机中应用,计算机技术在计算基因组学中的应用和挑战小议...

随着生物实验技术的不断进步,人们获得了大量数据,包基因序列、核酸结构、蛋白质结构、化学小分子等。计算机的出现为这些数据提供了存储、分析的媒介。通过收集病人的基因数据,建立相应的疾病数据库,可为病人以后的诊断做指导,也可以为由于基因突变引起的疾病的药物设计做指导。基因组测定技术的发展还为研究个性化药物提供了条件:由于人与人之间存在遗传和所处的环境等各种差异导致每个人对某一种药物的反应各不相同。通过对病人的基因序列进行分析,可以辅助判断病人所患疾病的种类。例如,医生通过分析病人的基因,可以判断病人是否有生育缺陷,以及分析癌症的分子分型。随着更多基因组的测定,科学家和临床医生则有可能研究一些复杂疾病(如癌症、糖尿病、心血管疾病等)中基因所扮演的角色。

但是,大量数据的存储、检索和分析对计算机提出了更高的要求,同时也对程序设计中时间复杂度的控制有了更高的要求特别是一些重要的数据中心,对于高性能计算机的需求更加迫切。随着新一代测序技术的发展每天测得的序列都呈指数级增加。例如,一台高通量的测序仪每天能产生约100GB的数据,而在我国华大基因,有一百多台测序仪在近乎满负荷运行。因此,磁盘的读写速度及稳定性成为计算生物学对计算机的基本要求。随着测序技术的进一步发展,测序所需成本继续降低,基因测序的需求将进一步提高,相应的存储空间和内存也需要进步增大。基因组数据拼接、网络分析等给现有的计算资源带来极大挑战,部分计算需要的内存已经达到甚至超过TB级别。

f5bbaa50ff6a828622d6633f0ac73b4e.png

虽然并行化、图形处理器(GPU)等高性能计算技术使得计算能力日益提高,但仍不能满足个性化药物设计的基因组计算需求。一方面,人类全基因组的30亿对碱基对之间的比对复杂度非常高,许多基因与序列之间的关系尚不明确,需要不断提高和改进各种算法;另一方面,基因家族聚类进化分析和统计分析等处理过程和序列功能挖掘算法都需要更复杂的处理过程和更强大的计算能力支撑,并且面临着优化算法和提高批量数据处理能力的挑战。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值