DNA序列( DNA Consensus String)是由一串字母表示的真实的或者假设的携带基因信息的DNA分子的一级结构。
DNA序列的构成基于四种特定的碱基,分别是腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和胞嘧啶(C)。这些碱基以特定的配对方式形成碱基对,即A与T配对,C与G配对,这是基于它们之间的氢键相互作用。每个碱基代表一个特定的遗传信息,通过这些碱基的排列顺序,DNA序列能够编码遗传信息,进而指导生物体的生长、发育和功能。(在RNA序列中,U取代了DNA序列中的T)
DNA序列的测定是生物信息学中的一个重要环节,它涉及到对DNA中碱基序列的精确测定,这对于理解基因功能、疾病机制以及生物进化等方面具有重要意义。生物信息学中的数据库和工具,如GenBank数据库、EMBL数据库和DDBJ数据库,为DNA序列的存储、检索和分析提供了强大的支持。
此外,DNA序列的多样性不仅体现在其碱基对的排列上,还包括“junk DNA”,即不编码蛋白质的DNA区域,这些区域虽然不直接参与蛋白质编码,但在基因调控、进化等方面可能发挥着重要作用。因此,对DNA序列的深入研究不仅有助于我们理解生命的遗传基础,还为疾病诊断、治疗以及生物技术的发展提供了重要依据。
什么是DNA?DeoxyriboNuclec Acid
DNA是一种长链聚合物( polymer chains),组成单位为四种脱氧核苷酸。DNA就是生物基因编码,以蛋白质细胞的形式体现。其中,DNA的基本单位有四种脱氧核苷酸( nucleotides):腺嘌呤(dAMP )、胸腺嘧啶(dTMP )、胞嘧啶(dCMP )、鸟嘌呤(dGMP )。
德国学者马丁.舒伯格博士(Dr. Martin Schönberger )在他1973年出版的《易经与遗传密码—生命的奥秘》( I Ching & the Genetic Code: The Hidden Key to Life)一书中有一段清楚的叙述,惊奇地揭示出这64个遗传密码子与64卦象的对应关系,并建立起自然界普遍系统的假设,多次验证了64卦象和遗传密码的一致性。
1990年日本学者间中喜雄将嘌呤类假定为阴(A 太阴 和 G 少阴),嘧啶类假定为阳(T 太阳 和 C少阳),应用到遗传密码表中解读易学,结果表示氨基酸的三联体惊人地与“易经八卦”相对应。
DNA序列是如何测定的?
1975年英国生化学家 Frederick Sanger 发明了末端终止法DNA测序技术,打开了我们解读生命天书的大门,人们第一次真正看到了生命的最基本信息是什么样子,所谓的基因到底包含了哪些内容。随着了解的信息逐渐积累,量变产生了质变,我们得到了一些规律,而随之而来的却是更多的问题和困惑,研究工作愈加深入,我们就会发现自己的了解愈加贫乏。这就像战争催生技术革命一样,需求总是技术发展的源动力,从而日新月异的信息获取手段——测序技术——获得了长久不衰的发展,其过程就是序列获得→原理发现→了解深入→疑问产生→寻求答案→更多的序列获得需求→新技术产生→更多序列的获得→更深入的了解和更深入的疑问,正是这样周而复始的螺旋上升过程,推动了生命科学进入高速发展的轨道。
DNA序列分类(2000年数学建模竞赛题)