计算机科班出身,做生物学分析难免对概念理解有些吃力,日常主要做DBA,最近领导让我转战RNAseq分析,脚本要写,理论,肯定也要有些基础的,很多高中背的滚瓜烂熟的基础知识,全都还给老师了,好吧,度娘,请从我脑海里挖出来。。。
1、染色体(Chromosom)、DNA、基因(gene)
染色体:DNA和蛋白质组成染色质,染色质是染色体构成的基本单位,核小体(nucleosome)是构成染色质的基本单位
DNA:双链核糖核苷酸序列,可以通过转录表达蛋白质,调控生物过程
基因:有遗传效应的DNA片段,有外显子和内含子
RNA:DNA转录成RNA,包括编码RNA(可以翻译成蛋白质)和非编码RNA
2、RNA的分类
3、转录组(transciptom)、转录本(transcript)
转录组:特地条件下,DNA转录形成的所有mRNA、noncoding RNA、small RNA的总称
转录本:一条基因,通过转录形成一种或多种可编码蛋白质的成熟mRNA的集合
4、RNAseq测序基本流程
引用百度百科:
RNA-seq即转录组测序技术,就是把mRNA,smallRNA,and NONcoding RNA等或者其中一些,用高通量测序技术进行测序分析,反映出它们的表达水平。
下一步,就是对Illumina的测序文件进行分析,找出差异表达基因,gene fusion等