这两年随着测序成本的下降和转录组研究的日渐火热,RNA-seq俨然已经成为了分子生物学课题组推进项目的首选方向。在我们接触的转录组项目中,有些老师对项目分析结果存在或多或少不清楚或有疑惑的地方。那么春天来了,花儿开了,今天福利也到了,我们特意将转录组项目中常见的一些问题进行了汇总,各位老师可以按需自取哈。
1.如何判定生物学重复一致性的高低?生物学重复统计方法及公式
答:(1)皮尔逊相关系数r可以作为生物学重复相关性的评估指标,理想的生物学重复试验r20.92。考虑到个体差异、取材环境、时间以及人员操作熟练程度等因素对测序数据的影响,一般r20.8为可接受范围。
(2)Pearson(皮尔逊)相关系数:皮尔逊相关也称为积差相关(或积矩相关)是英国统计学家皮尔逊于20世纪提出的一种计算直线相关的方法。
2.DEG基因用Transcripts还是Unigenes?
答:DEG基因用的是Unigene。
3.transcript-id代表什么意思?为什么有的基因有多个transcript-id?
答:基因转录本id;因为可变剪切的缘故,一个基因可能有多个转录本。
4.在miRNA鉴定中,可能成为miRNA的reads是怎样计算的?哪些条件会影响到mrd值?micro
RNA在不同组织有异构体的存在,是如何处理的?
答:与 Rfam, miRbase, RepBase和 Exon\Intro 序列库进行比对,获得 sRNA
注释信息,以此作为预测新的 miRNA 的基础。
miRNA的鉴定是利用miRDeep2软件进行已知及新(保守及非保守)的miRNA鉴定。miDeep2会在reads比对到基因组上的位置两端分别延伸75、15bp进行结构预测,此软件认为极可能与可能是miRNA的根据是通过mrd值来区分的,mrd>-10为可能,mrd>0为极可能;
影响mrd值的有reads在基因组上的分布和碱基结合的自由能等;
5.对于有生物学重复的项目,怎样计算差异基因?
答:两两比对使用的是R的EBseq包,
是基于负二项分布检验的方式对reads数进行差异显著性检验,重复间的比对使用的是R