edgeR的介绍
背景
RNA-seq表达谱与生物复制的差异表达分析。 实现一系列基于负二项分布的统计方法,包括经验贝叶斯估计,精确检验,广义线性模型和准似然检验。 与RNA-seq一样,它可用于产生计数的其他类型基因组数据的差异信号分析,包括ChIP-seq,Bisulfite-seq,SAGE和CAGE。
简介
edgeR包是进行RNA-seq数据分析非常常用的一个R包。该包需要输入每个基因关于每个样本的reads数的数据,每行对应一个基因,每一列对应一个样本。edgeR作用的是真实的比对统计,因此不建议用预测的转录本。
归一化原因:
技术原因影响差异表达分析:
1)Sequencing depth:统计测序深度(即代表的是library size);
2)RNA composition:个别异常高表达基因导致其它基因采样不足
3)GC content: sample-specific effects for GC-content can be detected
4)sample-specific effects for gene length have been detected
注意:edgeR必须是原始表达量,而不能是rpkm等矫正过的。
1.读取表达矩阵文件
>SFTSV_24vscontrol_circ
2.构建分组变量
分为control组和SFTSV_24组,每组都为三个重复
>group
3.构建DGElist对象
这