生物数据库之核酸数据库
参考:山东大学生物信息学MOOC(学习笔记)
一、为什么需要生物数据库?
-上图这密密麻麻是啥?
-答对了,就是DNA
事实上,**这是HIV I病毒的整个基因组,包含9752个碱基,编码9个基因。**差不多一页A4纸,正反面打印,就能讲这九千多个碱基记录下来。
当然病毒的基因组很小,与之相比,我们人类的基因组要大得多啦!
人的基因组有3G bp, 也就是3,000,000,000个碱基,一页A4纸可以打印5000个碱基的话,我们需要打印60万页,才能把整个人类的基因组给记录下来。
所以,这么宏大的信息量,我们必须要建立电子数据库来保存。
事实上,一块3T的硬盘就能将上述信息收集保存,但是我们不仅仅要记录,还要支持访问、管理和更新,这样一套存储空间加上完整的管理系统才能构成我们所说的数据库系统。
因此我们说,生物数据库是被组织起来的大量生物数据,这些数据通过计算机可以被方便的访问、管理及更新。
说到这,我们要了解一下天文数字单位:
下面的关系千万不要弄混淆了喔:
1 T = 1 0 3 G = 1 0 6 M = 1 0 9 K 1T=10^3G=10^6M=10^9K