计算机背景的生物信息学,生物信息学产生的背景

最新推荐文章于 2022-07-14 14:44:21 发布

王雷Neo

最新推荐文章于 2022-07-14 14:44:21 发布

阅读量303

点赞数

文章标签：计算机背景的生物信息学

该楼层疑似违规已被系统折叠隐藏此楼查看此楼

基于序列的生物学时代已经到来，尽管对“序列生物学”这一提法可能有所争议，但是今日像潮水般涌现的序列信息却是无可争辩的事实。

自从1990年美国启动人类基因组计划以来，人与模式生物基因组的测序工作进展极为迅速。迄今已完成了约40多种生物的全基因组测序工作，人基因组约3x109碱基对的测序工作也接近完成。至2000年6月26日，被誉为生命“阿波罗计划”的人类基因组计划，经过美、英、日、法、德和中国科学家的艰苦努力，终于完成了工作草图，这是人类科学世上又一个里程碑式的事件。它预示着完成人类基因组计划已经指日可待。截止目前为止，仅登录在美国GenBank数据库中的DNA序列总量已超过70亿碱基对。在人类基因组计划进行过程中所积累起来的技术和经验，使得其它生物基因组的测序工作可以完成得更快捷。可以预计，今后DNA序列数据的增长将更为惊人。生物学数据的积累并不仅仅表现在DNA序列方面，与其同步的还有蛋白质的一级结构，即氨基酸序列的增长。

此外，迄今为止，已有一万多种蛋白质的空间结构以不同的分辨率被测定。基于cDNA序列测序所建立起来的EST数据库其纪录已达数百万条。在这些数据基础上派生、整理出来的数据库已达500余个。这一切构成了一个生物学数据的海洋。可以打一个比方来说明这些数据的规模。有人估计，人类(包括已经去世的和仍然在世的)所说过的话的信息总量约为5唉字节(1唉字节等于1018字节)。而如今生物学数据信息总量已接近甚至超过此数量级。这种科学数据的急速和海量积累，在人类的科学研究历史中是空前的。

数据并不等于信息和知识，但却是信息和知识的源泉，关键在于如何从中挖掘它们。与正在以指数方式增长的生物学数据相比，人类相关知识的增长(粗略地用每年发表的生物、医学论文数来代表)却十分缓慢。一方面是巨量的数据；另一方面是我们在医学、药物、农业和环保等方面对新知识的渴求，这些新知识将帮助人们改善其生存环境和提高生活质量。这就构成了一个极大的矛盾。这个矛盾就催生了一门新兴的交叉科学，这就是生物信息学。

美国人类基因组计划实施五年后的总结报告中，对生物信息学作了以下定义：

生物信息学是一门交叉科学，它包含了生物信息的获取、处理、存储、分发、分析和解释等在内的所有方面，它综合运用数学、计算机科学和生物学的各种工具，来阐明和理解大量数据所包含的生物学意义。生物信息学这一名词的出现仅仅是几年前的事情，但是计算生物学这一名词的出现要早的多。鉴于这两门学科之间并没有或难以界定严格的分界线，在这里统称为生物信息学。