生物相关概念

一、中心法则

生物学中的中心法则(Central Dogma of Molecular Biology),是由弗朗西斯·克里克在1958年首次提出的,用于描述生物体内遗传信息的基本流动方向。中心法则主要包括以下三个方面:

  1. DNA复制:遗传信息从DNA传递给DNA,即在细胞分裂时,亲代DNA分子通过半保留复制方式产生两个完全一样的子代DNA分子。

  2. 转录:遗传信息从DNA传递给RNA,即在细胞核内,特定基因的一部分DNA作为模板合成一条互补的mRNA(信使RNA)分子。

  3. 翻译:遗传信息从mRNA传递给蛋白质,即在细胞质的核糖体上,mRNA上的密码子指导氨基酸按照特定顺序连接起来形成蛋白质。

此外,随着科学研究的发展,中心法则得到了补充和完善:

  • 逆转录:在某些RNA病毒(如HIV)中,遗传信息可以从RNA逆向传递给DNA,这个过程称为逆转录,需要逆转录酶的催化。
  • RNA复制:某些RNA病毒(如烟草花叶病毒)可以进行RNA到RNA的直接复制。

总的来说,中心法则是生物学的核心原理之一,它强调了遗传信息传递的单向性和方向性,尽管存在逆转录和RNA复制等特例,但这些过程并未改变中心法则关于遗传信息基础流向的本质。

二、CRISPR/Cas系统

CRISPR/Cas是(clustered regularly interspaced short palindromic repeats/CRISPR associate)成簇规律间隔短回文重复序列及相关蛋白质缩写。包括CRISPR阵列和Cas基因簇两个部分。普遍存在于细菌和古菌中的一类古老的免疫系统,用于抵御防御外源遗传元件(例如噬菌体)入侵。

组成

1.CRISPR基因序列(CRISPR Array)

CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)是指在细菌和古菌基因组中发现的一段特殊DNA序列区域,由前导序列(leader)、重复序列(repeat)和间隔序列(spacer)构成:

  • 前导序列(Leader region): 位于CRISPR区域的上游,富含AT碱基,可能起到调控CRISPR转录的作用,被认为是CRISPR序列的启动子。
  • 重复序列(Repeats): 短的、高度保守的DNA序列,多次重复排列,其间被间隔序列(spacers)隔开,长度约20–50bp碱基,包含5–7bp回文序列,转录产物可以形成发卡结构,用于稳定RNA的整体二级结构。
  • 间隔序列(Spacers): 这些序列是从先前入侵的噬菌体或质粒捕获的DNA片段,每一个都对应一种曾经攻击过宿主的外来遗传物质。当相同或相似的外源DNA再次入侵时,对应的间隔序列会指导Cas蛋白进行针对性的防御。

2.Cas(CRISPR-associated)基因

位于CRISPR基因附近或分散于基因组其他地方,该基因编码的蛋白均可与CRISPR序列区域共同发生作用,在防御过程中至关重要,目前已经发现了Cas1-Cas10等多种类型的Cas基因。

Cas基因编码一系列蛋白质,这些蛋白质与CRISPR阵列协同工作,形成了CRISPR/Cas系统的功能实体。Cas蛋白种类多样,按照功能和结构差异,科学家将CRISPR/Cas系统分为若干类型(如I、II、III、IV、V、VI等)。每种类型包含不同数量和类型的Cas蛋白。这些蛋白参与了CRISPR免疫机制的各个阶段,包括新spacer序列的获取(适应阶段)、crRNA的生成(表达和成熟阶段)以及目标DNA的识别与切割(干扰阶段)。

分类(两类六型)

  • 1类包括Ⅰ型、Ⅲ型和Ⅳ型,通过多个Cas蛋白发挥功能,Class1系统的效应复合物由4-7个Cas蛋白亚基组成,该类别的共同特征是利用多个Cas蛋白效应复合物实现干扰靶标核酸,占已鉴定CRISPR/Cas位点的90%;
  • 2类包括Ⅱ型(Cas9)、Ⅴ型(Cas12)和Ⅵ型(Cas13),通过单一的Cas蛋白发挥功能,Class2系统的效应复合物则是单个多结构域蛋白,占已鉴定CRISPR/Cas位点的10%,是理想的基因编辑和体外检测工具。

组件(以CRISPR/Cas9系统为例)

  • crRNA (CRISPR RNA): crRNA来源于CRISPR阵列中的间隔序列(Spacer)。在一些类型的CRISPR-Cas系统(如I型和II型)中,crRNA包含了与目标DNA序列互补的部分,相当于"导向器",能指导Cas蛋白准确找到并切割目标DNA。在成熟的CRISPR-Cas系统中,crRNA通常是通过加工过程从pre-crRNA(前体crRNA)中产生的。

  • tracrRNA (trans-activating CRISPR RNA): tracrRNA最初在II型CRISPR-Cas系统(如Streptococcus pyogenes中的Cas9系统)中发现,它不直接与目标DNA互补,但会与crRNA配对形成双链RNA结构,从而稳定crRNA并协助Cas9蛋白识别和结合crRNA。tracrRNA和crRNA通过碱基配对组装成一个功能性复合体。

  • sgRNA (single guide RNA): sgRNA是CRISPR-Cas9基因编辑技术中常用的概念,尤其在人工合成的系统中。它是crRNA和tracrRNA功能的整合体,通过人工设计将crRNA部分和tracrRNA部分融合成一个单一的RNA分子,可以直接与Cas9蛋白结合并指引Cas9去切割与sgRNA互补的目标DNA序列。sgRNA的设计简化了实验操作,提高了基因编辑的效率。

  • Cas9蛋白:这是一种内切酶,能识别并结合特定的PAM序列(Protospacer Adjacent Motif),并在gRNA指导下对目标DNA进行双链切割。

免疫机制

分为3个阶段:适应阶段(Adaptation),表达阶段(Expression)和干扰阶段(Interference)

◆适应阶段

spacer捕获阶段,细菌识别出外源性DNA(病毒或者质粒),并且将其作为一个新的spacer整合到CRISPR位点前导序列的末端。

◆表达阶段

CRISPR RNA(crRNA)合成和表达的阶段,CRISPR位点转录出一个前体crRNA(pre-crRNA),随后合成成熟crRNAs,每个成熟的crRNA只包含一个spacer[12,13]。

◆干扰阶段

crRNA和Cas蛋白整合成一个蛋白效应复合物,利用crRNA识别和杀伤拥有与crRNA中spacer互补序列的任何噬菌体或质粒[12,13]。

简而言之,CRISPR阵列储存了对抗过去病原体的记忆,而Cas蛋白则执行实际的防御反应,通过与CRISPR RNA相互作用来识别和破坏入侵的遗传物质。CRISPR/Cas系统因其简单高效的特点,在基因编辑技术中得到了广泛应用,尤其是Cas9、Cas12和Cas13等蛋白成为实验室和临床研究中精准改造基因组的重要工具。

PAM

CRISPR靶向特异性是由两部分决定的,一部分是RNA嵌合体和靶DNA之间的碱基配对,另一部分是Cas9蛋白复合体和一个短DNA序列,这个短的DNA序列通常在靶DNA的3'末端作用,被称为PAM(protospacer adjacent motif,原间隔区相邻基序)

参考:

CRISPR Cas发展史、机制、分类及应用 (qq.com)

CRISPR/Cas系统简介 (qq.com)

「干货分享」CRISPR/Cas系统原理及Cas9与Cas12a区别 (baidu.com)

三、非同源末端连接和同源重组

非同源末端连接(Non-homologous End Joining, NHEJ)是一种在真核生物细胞中修复DNA双链断裂(DSBs)的重要机制,尤其是在没有同源模板DNA存在的条件下。这个过程不需要DNA序列的同源性匹配,而是直接将断裂的DNA两端连接起来

同源重组(Homologous Recombination,HR)是一种高度保守且精确的DNA修复途径,在所有生命形式中普遍存在,从原核生物到真核生物,包括细菌、酵母、植物和动物细胞。这一过程主要涉及DNA双链断裂的修复,或者是在减数分裂期间进行染色体的同源配对和交换,保证遗传物质的正确分配。

四、细胞内部结构和细胞器

线粒体(Mitochondria):被称为“细胞的动力工厂”,负责通过氧化磷酸化过程产生细胞所需的大部分能量(ATP)。

叶绿体(Chloroplasts):存在于植物和某些藻类细胞中,负责光合作用,利用光能转化为化学能,并固定二氧化碳生产有机物质

内质网(Endoplasmic Reticulum, ER):

  • 粗面内质网(Rough ER):因其表面附着有核糖体而得名,主要参与蛋白质合成和初步折叠,并向高尔基体输送新生肽链。
  • 光面内质网(Smooth ER):无核糖体附着,参与脂质合成、解毒、钙离子存储等。

高尔基体(Golgi Apparatus):对来自内质网的蛋白质进行进一步的加工、修饰、浓缩和包装,准备将它们输送到细胞内外目标位置。

溶酶体(Lysosomes):含有多种水解酶,负责细胞内消化和废物处理,包括分解衰老或损伤的细胞器以及摄入的异物。

液泡(Vacuoles):在植物细胞中尤其显著,可以占据细胞体积的很大一部分,参与储存水分、营养物质、离子平衡调节以及废物排除。

核糖体(Ribosomes):存在于细胞质中或内质网上,负责蛋白质的合成,读取mRNA上的遗传信息,通过翻译过程组装蛋白质。

中心体(Centrosomes):在动物细胞中参与有丝分裂时纺锤体的形成,帮助确保染色体正确分离。

过氧化物酶体( Peroxisomes):负责脂肪酸氧化、过氧化氢分解等代谢途径。

需要注意的是,不同类型的细胞可能不包含所有上述细胞器,例如,动物细胞通常不含叶绿体,而高等植物细胞则不含中心体。此外,细胞核虽然在一些定义中不被视为细胞器,但由于其在细胞内的重要地位和功能(如存储遗传信息、控制细胞活动),常被单独讨论。

五、蛋白质合成

蛋白质合成过程

蛋白质合成是一个复杂而精细的过程,主要分为两个阶段:转录和翻译。

转录(Transcription)

  1. 启动:在细胞核内,DNA特定区域(基因)的双链分开,RNA聚合酶识别并结合到DNA上的启动子序列。
  2. 合成mRNA:RNA聚合酶沿着DNA模板链移动,催化核苷酸之间形成磷酸二酯键,合成一条单链的前体mRNA。
  3. 后处理:前体mRNA经历剪接,去除内含子,保留外显子,并添加5'帽子和3'多聚腺苷酸尾巴,形成成熟的mRNA分子。
  4. mRNA输出:成熟的mRNA从细胞核转移到细胞质中,准备进行翻译。

翻译(Translation)

  1. 起始:mRNA进入细胞质后,与一个小核糖体亚单位以及起始tRNA(携带甲酰甲硫氨酸,且其反密码子与mRNA上的起始密码子AUG配对)结合,随后与大核糖体亚单位结合,形成完整的核糖体-mRNA-tRNA复合体。
  2. 延伸:核糖体沿着mRNA从5'端向3'端移动,每次读取下一个密码子。每遇到一个密码子,就有一个特定的tRNA,其携带对应氨基酸并以其反密码子与mRNA上的密码子配对。肽酰转移酶活性促使氨基酸间形成肽键,逐步延长肽链。
  3. 终止:当核糖体遇到终止密码子(UAA、UAG、UGA)时,没有对应的tRNA,而是释放因子介入,导致肽链合成停止,同时促使mRNA、tRNA和新生肽链从核糖体上释放。
  4. 后翻译修饰:新合成的多肽链可能需要进一步的加工,如剪切、折叠、修饰(如磷酸化、糖基化)等,以形成具有生物活性的成熟蛋白质,并最终定位到细胞的特定位置(如细胞质、细胞核、细胞膜或分泌到细胞外)。

蛋白质的结构

  1. 一级结构(Primary Structure)

    • 是指蛋白质分子中最基本的结构层次,指的是多肽链中氨基酸残基按照一定的顺序首尾相连形成的线性排列,这些氨基酸残基通过肽键连接在一起。一级结构完全由蛋白质分子中20种常见氨基酸的种类和顺序决定,且这种顺序是由编码它的基因所确定的。此外,一级结构还包括在某些氨基酸残基之间可能存在的二硫键,它们通过巯基间的氧化反应形成,有助于稳定蛋白质的空间构型。
  2. 二级结构(Secondary Structure)

    • 在一级结构的基础上,多肽链通过氢键形成稳定的局部构象。常见的二级结构类型包括:
      • α-螺旋(alpha-helix):多肽链围绕其长轴形成螺旋状结构,其中每个氨基酸残基的羰基氧和相邻残基的氨基氢之间形成氢键。
      • β-折叠(beta-sheet):多肽链以几乎平直的形式排列,通过氢键使链内的主链形成平面的“折迭”结构,可以是平行排列也可以是反平行排列。
      • 还包括其他不规则的二级结构元素,如β转角(beta-turns)和γ转角(gamma-turns)等。
  3. 三级结构(Tertiary Structure)

    • 是指整个多肽链在三维空间中的排列方式,由二级结构元素进一步折叠、盘旋和扭曲而来。三级结构的形成是通过一系列非共价键(如氢键、疏水作用、范德华力、盐桥、π-π堆积等)使得多肽链的不同部位之间相互作用的结果。这种整体的三维构型赋予了蛋白质执行其生物学功能所需的特定空间形态。

总结来说,一级结构是蛋白质的基本构建模块,二级结构是局部区域的稳定构象,而三级结构则是整条多肽链在三维空间中的完整形态布局。这三个层次的结构共同决定了蛋白质分子的生物活性和功能特性。对于一些由多个单独多肽链(亚基)组成的蛋白质,这些亚基会进一步通过非共价键相互结合,形成所谓的四级结构。

参与细胞器

  1. 核糖体

    • 核糖体是蛋白质合成的直接场所,负责将mRNA上的遗传信息翻译成氨基酸序列,形成多肽链。在真核细胞中,有两种类型的核糖体:游离核糖体(位于细胞质基质中)和膜结合核糖体(附着在内质网上的核糖体)。
  2. 内质网

    • 膜结合的核糖体在内质网上合成蛋白质,特别是一些分泌蛋白和膜蛋白。合成过程结束后,新合成的蛋白质链会直接穿过内质网膜,进入内质网腔内,进行初步的折叠和修饰。
  3. 高尔基体

    • 内质网内初步加工后的蛋白质会被囊泡包裹并通过囊泡运输到高尔基体。高尔基体对蛋白质进行进一步的修饰(如糖基化)、分拣和打包,然后将成熟或待分泌的蛋白质送至细胞膜,准备分泌出细胞或者送到溶酶体进行降解。
  4. 线粒体

    • 线粒体虽然不直接参与蛋白质合成,但在整个过程中提供能量(ATP),确保蛋白质合成、折叠和运输过程的能量需求。
  5. 溶酶体(对于某些蛋白质):

    • 对于某些需要在溶酶体内部合成和加工的蛋白质,它们在内质网和高尔基体之间的转运过程中被标记,然后在溶酶体中进行最终的成熟和功能化。
  6. 过氧化物酶体(对于特定种类蛋白质):

    • 对于某些需要在过氧化物酶体中进行加工的蛋白质,过氧化物酶体会参与到这部分蛋白质的合成后修饰中。
  7. 细胞核

    • 虽然不是严格意义上的细胞器,但细胞核中的DNA转录成mRNA是蛋白质合成的前提。mRNA离开细胞核后才进入翻译阶段。

综上所述,核糖体是蛋白质合成的核心场所,而内质网、高尔基体、线粒体等细胞器在蛋白质合成后的加工、折叠、修饰、运输以及能量供应等方面发挥了不可或缺的作用。

六、氨基酸

氨基酸的组成

氨基酸的化学组成是由一个中心碳原子(α-碳原子)、一个氨基(-NH2)、一个羧基(-COOH)以及一个侧链(也称为R基团)组成。

  1. 中心碳原子(α-碳原子):位于氨基酸分子的中心,连接着氨基、羧基和侧链。

  2. 氨基(-NH2):位于α-碳原子的上方,具有碱性,可以与酸反应形成酰胺键。

  3. 羧基(-COOH):位于α-碳原子的下方,具有酸性,可以与碱反应形成酯键。

  4. 侧链(R基团):连接在α-碳原子上,根据其化学性质,侧链可以分为非极性疏水性侧链、极性非带电侧链、酸性侧链和碱性侧链。侧链的差异导致了氨基酸之间的不同性质和功能。

氨基酸是蛋白质的基本组成单位,它们通过脱水缩合反应形成肽键,进而连接成多肽链,最终折叠成具有特定功能的蛋白质。氨基酸的化学性质和侧链类型决定了它们在蛋白质中的结构和功能。

氨基酸的种类

构成蛋白质的基本单位,氨基酸的种类有22种。

其中8种氨基酸(赖氨酸、色氨酸、苯丙氨酸、甲硫氨酸、苏氨酸、异亮氨酸、亮氨酸、缬氨酸)人体自身无法合成,必须从外源补充,称为必需氨基酸。

氨基酸残基

组成多肽的氨基酸在相互结合时,由于其部分基团参与了肽键的形成而失去一分子水,因此把多肽中的氨基酸单位称为氨基酸残基。即由肽键连接的氨基酸失水后剩余部分。

简单的说,氨基酸残基就是指不完整的氨基酸。一个完整的氨基酸包括一个羧基(—COOH),一个氨基(—NH2),一个H,一个R基。缺少任何一个部分都算是氨基酸残基,并没有包括肽键的。

甘氨酸残基为:—NH—CH2—CO—

七、染色质

染色质是指间期细胞核内由DNA组蛋白非组蛋白及少量RNA 组成的线性复合结构,是间期细胞遗传物质存在的形式。

八、Aptamer

Aptamer(适配体)是一种短链寡核苷酸(通常是DNA或RNA),通过体外筛选技术,例如指数富集配体系统进化技术(SELEX),从大量随机合成的寡核苷酸库中筛选得到。这些筛选出的核酸序列具有高度选择性和特异性,能够以较高的亲和力与靶标分子(包括但不限于蛋白质、小分子化合物、甚至整个细胞)进行结合。类似于抗体,适配体能够识别并结合其靶标,但由于其是由核酸构成,相较于抗体,它们在稳定性、化学合成便捷性、以及易于功能化等方面具有独特的优势。

适配体因其独特的性质,在生物医学研究、药物开发、疾病诊断和治疗等多个领域有着广泛的应用潜力,例如作为分子探针、药物载体、或者用于疾病标志物的高灵敏度检测等。

九、顺式调节元件(CRE)

        顺式调节元件(Cis-Regulatory Elements, CRE)是位于基因附近或内含于基因中DNA序列,它们能够调控该基因的转录活性,但不编码任何蛋白质。这些元件通过与特定的转录因子或其他调控蛋白结合,影响基因的表达水平、时间和空间特异性。

CRE可以包括启动子、增强子、沉默子、绝缘子等各种元件。例如

启动子是RNA聚合酶识别并结合的区域,是转录起始的关键位点;

增强子则能增强基因的转录活性,其位置和方向相对基因并不固定;

沉默子则抑制基因转录;

绝缘子可以阻止或允许增强子或抑制子对基因的影响。

因此,研究顺式调节元件对于理解基因表达调控机制及其在发育、疾病发生等过程中的作用具有重要意义。

十、常见RNA

  1. 信使RNA (mRNA) - 负责将DNA中的遗传信息转录并携带到细胞质中的核糖体,作为蛋白质合成的直接模板。mRNA携带着编码特定氨基酸序列的信息,指导蛋白质的合成。

  2. 转运RNA (tRNA) - 功能在于识别mRNA上的遗传密码子并将对应的氨基酸运送到核糖体,参与蛋白质合成。tRNA的结构特点使其能够精确匹配mRNA上的三联体密码子,并携带特定的氨基酸。

  3. 核糖体RNA (rRNA) - 是构成核糖体的主要成分,核糖体是蛋白质合成的场所。rRNA不仅提供结构支持,还具有催化活性,参与肽键的形成,即氨基酸之间的连接。

除了这三种主要的RNA类型,还有其他几种功能性RNA,它们在调控基因表达、RNA剪接、稳定性和降解等方面发挥重要作用:

  1. 长链非编码RNA (lncRNA) - 指长度超过200个核苷酸的RNA分子,它们不编码蛋白质,但参与调控基因表达、染色质修饰和细胞过程调控等多种生物学功能。

  2. 微RNA (miRNA) - 短小的非编码RNA分子,约21-23个核苷酸长,通过与mRNA配对影响其稳定性或翻译效率,从而调节基因表达。

  3. 小干扰RNA (siRNA) - 通常为20-25个核苷酸,参与RNA干扰(RNAi)过程,通过与特定mRNA完全配对导致其降解,用于基因沉默。

  4. Piwi相互作用RNA (piRNA) - 主要在动物生殖细胞中发现,参与转座子沉默和保护基因组免受转座元件的破坏。

  5. 小核仁RNA (snoRNA) - 主要在核仁中发现,参与rRNA的修饰,如甲基化和假尿嘧啶化,对rRNA的成熟和功能至关重要。

  6. 小核RNA (snRNA) - 参与剪接过程,形成剪接体的一部分,帮助从前体mRNA中去除内含子,连接外显子。

十一、ncRNA

非编码RNA(non-coding RNA, ncRNA)是一类不以编码蛋白质为目的的RNA分子,它们在细胞内扮演着多种至关重要的角色,参与调控基因表达、染色质结构、细胞分化、代谢途径等多种生物学过程。非编码RNA约占人类基因组转录产物的90%以上,显示了其在基因调控网络中的复杂性和重要性。

分类与功能

非编码RNA可以根据其长度、结构和功能被分为不同的类别:

  1. 小分子非编码RNA

    • microRNA (miRNA):约22个核苷酸长,通过与mRNA配对影响其稳定性或翻译效率,从而调控基因表达。
    • small interfering RNA (siRNA):同样约为20-25个核苷酸,参与RNA干扰过程,指导特定mRNA的降解。
    • piwi-interacting RNA (piRNA):主要在生殖细胞中发现,参与转座子沉默和保护基因组完整性。
  2. 中等长度非编码RNA

    • transfer RNA (tRNA) 和 ribosomal RNA (rRNA):分别负责氨基酸转运到核糖体和构成核糖体结构,参与蛋白质合成。
    • small nuclear RNA (snRNA) 和 small nucleolar RNA (snoRNA):参与RNA剪接和核糖体RNA的修饰。
  3. 长链非编码RNA (lncRNA):长度超过200个核苷酸,这类RNA在调控基因表达、染色质修饰、X染色体失活(如Xist RNA)等方面发挥重要作用。LncRNA可以顺式或反式作用于基因表达调控。

特点与作用

  • 基因表达调控:通过多种机制调控基因转录、转录后加工以及翻译过程。
  • 染色质结构与修饰:参与形成染色质的活性或静默区域,如通过与特定蛋白复合体结合,影响染色质的紧密程度。
  • 细胞周期与分化:在细胞命运决定、干细胞维持、以及细胞周期调控中发挥作用。
  • 疾病相关性:ncRNA的异常表达与多种疾病,包括癌症、神经退行性疾病等有关,因此成为疾病诊断与治疗的新靶点。

研究进展

随着高通量测序技术的发展,越来越多的非编码RNA被发现,它们的功能和调控机制正逐渐被揭示。RNA干扰(RNAi)技术的应用使得研究者能够更精确地操控特定ncRNA,探索其在生理和病理过程中的作用,同时也为疾病治疗提供了新的策略。未来的研究将继续深入理解ncRNA的复杂网络及其在生命过程中的精细调控作用。

常见的ncRNA

  1. MicroRNA (miRNA):长度约为22个核苷酸,通过与靶mRNA部分配对影响基因表达,主要机制是导致mRNA的降解或抑制其翻译。

  2. Small Interfering RNA (siRNA):也是约20-25个核苷酸长,与miRNA类似,参与RNA干扰途径,特异性地引导目标mRNA的切割和降解。

  3. Piwi-Interacting RNA (piRNA):主要存在于动物的生殖细胞中,长度可变,参与转座子沉默和保护遗传物质的稳定。

  4. Transfer RNA (tRNA):负责将特定的氨基酸运送到正在合成的肽链上,参与蛋白质生物合成过程。

  5. Ribosomal RNA (rRNA):构成核糖体的主要成分,参与翻译过程,是蛋白质合成机器的核心部分。

  6. Small Nuclear RNA (snRNA):参与剪接过程,帮助去除mRNA前体中的内含子。

  7. Small Nucleolar RNA (snoRNA):参与核糖体RNA(rRNA)和其他RNA分子的修饰,比如甲基化和假尿嘧啶化。

  8. Long Non-Coding RNA (lncRNA):长度超过200个核苷酸,甚至可达数千个核苷酸,参与基因表达调控、染色质修饰、细胞周期调控等多个方面。

  9. Circular RNA (circRNA):一种特殊的非编码RNA,因其特殊的环状结构而得名,可能参与调控基因表达、作为miRNA海绵或者参与蛋白质相互作用。

  10. Enhancer RNA (eRNA):虽然功能仍在研究中,但已知参与增强子活性的调控,影响附近基因的表达。

十二、密码子和ORF(开放阅读框)

密码子(Codon)是遗传学中的一个基本概念,特指信使RNA(mRNA)分子上决定一个氨基酸的三个相邻核苷酸组成的特定序列。由于mRNA分子由四种核苷酸(腺嘌呤A、胞嘧啶C、鸟嘌呤G、尿嘧啶U)组成,因此存在64种(4^3)可能的不同密码子组合。

每个密码子与一种特定的氨基酸相对应,除了三个终止密码子(UAA、UAG、UGA),它们不编码任何氨基酸,而是指示蛋白质合成过程中的终止位点。这61个编码氨基酸的密码子中,有些氨基酸是由多个密码子编码的,这种现象称为简并性,意味着即使密码子有所不同,也可能编码相同的氨基酸,增加了遗传密码的容错性。

密码子的阅读是从mRNA的5'端向3'端进行,而携带氨基酸的转运RNA(tRNA)通过其反密码子与mRNA上的密码子互补配对,确保正确的氨基酸被添加到正在合成的蛋白质链上。这一过程是蛋白质生物合成(翻译)的关键步骤,确保了基因信息准确地转化为特定序列的氨基酸,进而折叠成具有特定功能的蛋白质分子。

ORF(开放阅读框)

ORF(Open Reading Frame,开放阅读框)指的是DNA或RNA序列中一段连续的、不包含终止密码子的编码区。在这段区域内,从起始密码子(通常是ATG)开始,按照遗传密码的规则,可以连续地翻译成氨基酸序列,直到遇到终止密码子(如TAA、TAG、TGA)为止。

ORF是基因表达的核心概念之一,它决定了蛋白质合成的起始和终止位置。在基因组学和蛋白质组学研究中,识别和分析ORF对于预测基因功能、鉴定新基因以及研究基因表达调控等方面具有重要意义。

十三、“多义性”(Ambiguity)

多义性”(Ambiguity通常用于描述序列解读时可能出现的不确定性,比如在测序过程中遇到的单个碱基位置可能存在多种解读的可能性。但在上下文中提到“双义基因组”(Ambisense Genome),这是一个特定概念,指的是某些病毒基因组的特性,其正链(正义链)和负链(反义链)都能够编码蛋白质,即在同一段DNA或RNA分子的两条链上都具有可读框(开放阅读框ORF),从而实现双重编码功能。

十四、剪切位点

剪切位点(Splice Site)是真核生物基因组中一种重要的序列标志,它们指定了内含子(非编码序列)和外显子(编码序列)的边界。在基因转录过程中,DNA首先被转录成前体mRNA(也称作初级mRNA或pre-mRNA),此时的mRNA分子包含了内含子和外显子的序列。为了生成能够被翻译成蛋白质的有效mRNA,细胞内的剪接体(spliceosome)必须识别并结合到剪切位点上,执行剪接过程,即移除内含子并将相邻的外显子连接起来,最终形成成熟的mRNA分子。

剪切位点通常由两个主要部分构成:

  • 5'剪切位点(5' splice site)位于内含子的5'端,通常是一个GU二核苷酸序列。
  • 3'剪切位点(3' splice site)位于内含子的3'端,典型的是一个AG二核苷酸序列。

这两个剪切位点的准确识别和剪接过程对于正常的基因表达至关重要,任何导致剪切位点突变的情况都可能影响mRNA的正常加工,进而引发蛋白质编码错误或减少有效mRNA的数量,与许多遗传性疾病的发生和发展密切相关。

十五、转录因子结合位点

       转录因子结合位点(Transcription Factor Binding Site, TFBS是指存在于基因组DNA序列中特定区域的短片段,这些片段能与转录因子(Transcription Factors, TFs)特异性地结合

        转录因子是一类蛋白质分子,它们在细胞内扮演着调控基因转录的重要角色。当转录因子与对应DNA结合位点相互作用时,能够激活抑制目标基因的转录活性,从而调控基因表达水平

        转录因子结合位点通常包含几个到二十几个碱基对(bp),具有高度特异性的序列,使得相应的转录因子能够通过其DNA结合域精确识别并结合上去。这种结合活动是细胞内信号传导途径的重要环节,也是实现复杂基因表达调控网络的基础。

        不同的转录因子对应不同的结合位点,并且同一转录因子可能在不同的基因上识别并结合多个相似但不一定完全相同的位点,参与多种生物学过程,包括发育、分化、应激反应以及疾病发生等。通过研究转录因子结合位点,科学家们可以深入了解基因调控机制,并有助于开发针对相关疾病的治疗策略。

十六、细胞周期

  1. 细胞分裂间期是为细胞分裂做准备的时间,主要完成的是DNA分子的复制和有关蛋白质的合成,同时,细胞有适度的生长,占据细胞分裂的绝大部分时间。有丝分裂重要的时期,细胞分裂间期分为3个时期:G1,S,G2
  2. 染色质是指间期细胞核内由DNA组蛋白非组蛋白及少量RNA 组成的线性复合结构,是间期细胞遗传物质存在的形式。

十七、真核细胞和原核细胞

真核细胞是有被核膜包被的成形的细胞核,遗传物质是 DNA。真核细胞有复杂的细胞器,如线粒体、叶绿体、内质网、高尔基体、核糖体、溶酶体等。真核细胞都有一层质膜,这是一层双层脂质,来将细胞内部和外部环境分离开来。质膜也是内膜系统的一部分

十八、进化约束

进化约束是指物种在进化过程中受到的限制,这些限制使得某些特征或性状不会在物种中出现。进化约束可以是内在的,由基因或生物体的生理结构决定,也可以是外在的,由环境因素或生态位决定。进化约束的存在意味着物种的进化不是无限制的,而是受到一定条件的制约。

进化约束在生物进化中起着重要作用,它们限制了物种的适应能力和多样性。例如,大象无法长出翅膀,因为它们的体型和骨骼结构不支持飞行;水母无法游得更快,因为它们的生理结构限制了它们的速度。这些约束使得物种在适应环境的过程中必须权衡各种因素,以保持其生存和繁衍的能力。

总之,进化约束是生物进化过程中的一个重要概念,它揭示了物种进化的限制和规律。了解进化约束对于研究生物进化和生物多样性具有重要意义。

十九、XNA

XNA是Xeno-Nucleic Acids的缩写,这是一类核酸类似物。XNAs是一大类物质的统称,例如PNA、LNA、TNA、GNA、CeNA和HNA等等。XNA这个名字最早是由Piet Herdewijn和Philippe Marliere于2009年提出的。虽然名字很新,但是XNA这一类化合物的研究历史却很悠久。XNAs是六种新化合物(HNA, CeNA, LNA, ANA, FANA, TNA, PNA)可以记录和复制遗传信息,使得遗传和进化这两个生命标志不再限制于DNA和RNA。在实验中,研究人员将一个DNA链条上的遗传信息传递到XNA上,随后再传回另一个DNA链条,遗传信息传递的准确度高达95%以上。此外,如果满足一些前提条件,部分XNA聚合物在试管中还能如DNA一样进化成不同形态。

总的来说,XNA是一类具有广泛应用的核酸类似物,它们可以模拟DNA的功能,并且在某些方面具有优于DNA的特性。

二十一、cfDNA和ctDNA

DNA存在于细胞内部的细胞核内。正常细胞内的DNA就是正常细胞DNA,而肿瘤细胞内的自然就是肿瘤DNA,两者的基本结构没有实际区别。

cfDNA全称为“cell-free DNA”,即细胞游离DNA,而ctDNA则为“circluting-tumor DNA”,即循环肿瘤DNA。同样的,这也是从来源上将DNA分为两类,并不是说这两者的基本结构上有区别。

顾名思义,ctDNA就是肿瘤细胞释放到血液中DNA,随血液在全身循环,故被称为循环肿瘤DNA;而cfDNA包含的范围则更广,包括ctDNA在内,加上其他正常细胞释放到血液中的DNA都被统称为cfDNA。

二十二、RNA的结构

RNA的结构可以分为三级:

1. 一级结构:

这是RNA链中核苷酸的线性序列,即腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和尿嘧啶(U)的排列顺序。

2. 二级结构:

这是RNA链中碱基之间的配对关系形成的局部结构,包括双螺旋区域(如茎环结构)和单链区域。二级结构可以通过碱基配对原则(如Watson-Crick配对和G-U wobble配对)来预测。RNA的二级结构通常包括以下几种类型的碱基配对:

1. Watson-Crick配对:腺嘌呤(A)与尿嘧啶(U)配对,鸟嘌呤(G)与胞嘧啶(C)配对。

2. G-U wobble配对:鸟嘌呤(G)可以与尿嘧啶(U)配对,这种配对不如标准的Watson-Crick配对稳定。

3. 非标准碱基配对:除了上述标准配对外,RNA中还可以形成一些非标准的碱基配对,如G-A、U-U等。

二级结构可以通过不同的方法进行预测,包括基于序列的方法基于热力学的方法以及结合多种信息的方法。预测RNA二级结构对于理解RNA的功能、识别非编码RNA以及研究RNA的折叠机制等方面都非常重要。

3. 三级结构:

这是RNA链在空间中的完整三维构象,包括二级结构元素之间的相互作用和全局折叠模式。三级结构的形成通常涉及碱基对间的相互作用、氢键、范德华力以及金属离子等。

RNA的三级结构对于其生物学功能至关重要,因为它决定了RNA如何与其他分子相互作用,以及RNA如何在细胞内定位和执行其功能。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值