seqkit根据基因id_RNA-Seq项目常见问题与解答

这篇博客汇总了RNA-seq项目中的常见问题,涉及生物学重复一致性评估、DEG基因选择、转录本ID含义、miRNA鉴定、差异基因计算方法、基因功能注释一致性、序列差异分析等方面,为分子生物学研究提供参考。
摘要由CSDN通过智能技术生成

这两年随着测序成本的下降和转录组研究的日渐火热,RNA-seq俨然已经成为了分子生物学课题组推进项目的首选方向。在我们接触的转录组项目中,有些老师对项目分析结果存在或多或少不清楚或有疑惑的地方。那么春天来了,花儿开了,今天福利也到了,我们特意将转录组项目中常见的一些问题进行了汇总,各位老师可以按需自取哈。

1.如何判定生物学重复一致性的高低?生物学重复统计方法及公式

答:(1)皮尔逊相关系数r可以作为生物学重复相关性的评估指标,理想的生物学重复试验r20.92。考虑到个体差异、取材环境、时间以及人员操作熟练程度等因素对测序数据的影响,一般r20.8为可接受范围。

(2)Pearson(皮尔逊)相关系数:皮尔逊相关也称为积差相关(或积矩相关)是英国统计学家皮尔逊于20世纪提出的一种计算直线相关的方法。

2.DEG基因用Transcripts还是Unigenes?

答:DEG基因用的是Unigene。

3.transcript-id代表什么意思?为什么有的基因有多个transcript-id?

答:基因转录本id;因为可变剪切的缘故,一个基因可能有多个转录本。

4.在miRNA鉴定中,可能成为miRNA的reads是怎样计算的?哪些条件会影响到mrd值?micro

RNA在不同组织有异构体的存在,是如何处理的?

答:与 Rfam, miRbase, RepBase和 Exon\Intro 序列库进行比对,获得 sRNA

注释信息,以此作为预测新的 miRNA 的基础。

miRNA的鉴定是利用miRDeep2软件进行已知及新(保守及非保守)的miRNA鉴定。miDeep2会在reads比对到基因组上的位置两端分别延伸75、15bp进行结构预测,此软件认为极可能与可能是miRNA的根据是通过mrd值来区分的,mrd>-10为可能,mrd>0为极可能;

影响mrd值的有reads在基因组上的分布和碱基结合的自由能等;

5.对于有生物学重复的项目,怎样计算差异基因?

答:两两比对使用的是R的EBseq包,

是基于负二项分布检验的方式对reads数进行差异显著性检验,重复间的比对使用的是R

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值