生信项目之生信名词解释

目录

一、高通量测序与Hi-C测序

二、宏基因组

三、启动子,终止子,起始密码子,终止密码子

四、Read,Reads,Contig,Contigs

五、CDS与ORF

六、测序深度与覆盖度

七、进化树,分子树,系统发生树


一、高通量测序与Hi-C测序

高通量测序技术(High-throughput sequencing)又称“下一代”测序技术(Next-generation sequencing technology),大规模平行测序(Massively parallel sequencing,MPS)。这种测序方法由其一次可以对几十万或几百万条DNA分子进行序列测定而命名。

Hi-C(High-throughput/resolution chromosome conformation capture)测序是一种以高通量测序为手段,以3C技术为基础的染色质构象捕捉技术。从而研究全基因组范围内整个染色质DNA在空间位置上的关系,获得高分辨率的染色质三维结构信息。

二、宏基因组

宏基因组(Metagenome)也称为微生物环境基因组(Microbial Environmental Genome), 其定义为“the genomes of the total microbiota found in nature” , 即环境中全部微小生物遗传物质的总和。宏基因组学是一种以环境样品中的微生物群体基因组为研究对象,以功能基因筛选或测序分析为研究手段,以微生物多样性、种群结构、进化关系、功能活性、相互协作关系及与环境之间的关系为研究目的的新的微生物研究方法。一般包括从环境样品中提取基因组 DNA, 进行高通量测序分析,或克隆 DNA 到合适的载体,导入宿主菌体,筛选目的转化子等工作。

三、启动子,终止子,起始密码子,终止密码子

起始密码子(iniation codon)指合成蛋白质起始位点的密码子,常见为AUG或GUG。

终止密码子(termination codon)指任何tRNA分子都不能正常识别的,但可被特殊的蛋白质结合并引起新合成的肽链从翻译机器上释放的密码子。

启动子(Promoter)指特定基因转录的DNA区域,在基因的非编码区,即编码区的上游,转录mRNA的时候与RNA聚合酶结合的位点,告诉RNA聚合酶从启动子开始转录但启动子本身并不被转录。启动子本身并不转录而且也不控制基因活动,而是通过转录因子结合来调控转录过程。

终止子(terminator)指用于告诉RNA聚合酶转录到此结束的DNA序列。

四者之间的区别是:启动子和终止子都是一段特殊的DNA序列,属于基因的非编码区,分别位于编码区的上游和下游,负责调控基因的转录,且长度远不止三个碱基。而起始密码子和终止密码子都是mRNA上的三联体碱基序列(均只含三个碱基),分别决定翻译的起始和终止。

四、Read,Reads,Contig,Contigs

​由于受目前测序水平的限制,基因组测序时需要先将基因组打断成DNA片段,然后再建库测序。Read指高通量测序时读出的一条序列,Reads是Read的集合。

Contig指很多的reads通过重叠片段(overlap)组装成的一个更大的片段。Contigs是Contig的集合。

五、CDS与ORF

CDS(Coding sequence)指蛋白质编码区,即与蛋白质序列一一对应的DNA序列。

ORF(open reading frame)指开放读码框,

是从一个起始密码子开始到一个终止密码子结束的一段序列。

因此,CDS与ORF之间的关系是,CD可能是一个或多个ORF;ORF不一定是CDS。

六、测序深度与覆盖度

测序深度(Sequencing Depth)指测序得到的碱基总量(bp)与待测基因组大小(Genome)的比值。覆盖度(coverage)指测序获得的序列占整个靶序列如基因组序列的比例。

它们的计算公式为:测序深度 = (读段长度 × 比对的读段数目)/ 测序目标区域大小;测序覆盖度 = 测序目标区域实际覆盖长度/ 测序目标区域大小。

测序深度与基因组覆盖度之间是一个正相关的关系,测序带来的错误率或假阳性结果会随着测序深度的提升而下降。测序深度关注的是测序的数据量大小,而覆盖度关注的是这些数据在基因组上的分布情况。在实际应用中,这两个指标通常都需要考虑,以确保测序结果既具有足够的数据量,又能覆盖基因组的各个区域。

七、进化树,分子树,系统发生树

进化树(Evolutionary Tree)又称为系统树或系谱树,用来表示物种之间的进化关系,根据各类生物之间的亲缘关系的远近,把各类生安置在有分枝的树状的图上,从而简明地表示生物的进化历程和亲缘关系。

分子树(Molecular Tree)是依据分子数据构建的反映分子系统发育的树。

系统发生树(Phylogenetic Tree)又称演化树,是表明被认为具有共同祖先的各物种之间演化关系的树,在树中每个节点代表其各分支最近的共同祖先,而节点间的线段长度对应演化距离。

  • 66
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值