转录组分析工具edgeR-DESeq2差异表达分析
edgeR 包的安装
∙edgeR 包是基于Bioconductor平台发布的,所以安装不能直接用install.packages()命令从 CRAN 上来下载
∙安装:
# try http:// if https:// URLs are not supported
>source("https://http://doc.xuehai.net/biocLite.R")
>biocLite("edgeR")
数据导入
∙由于 edgeR 对测序结果的下游分析是依赖 count 计数来进行基因差异表达分析的,在这里使用的是featureCounts来进行统计`.bam`
文件中 Map 的结果
∙count 结果如下:
>library(edgeR)
>mydata
>sampleNames
>names(mydata)[7:12]
>head(mydata)
GeneidChrStartEndStrandLengthCA_1CA_2CA_3CC_1CC_2CC_3
1gene1314NW_139421.112571745+489000000
2gene1315NW_139421.121153452+1338000000
3gene1316NW_139421.138564680+825000000
4gene1317NW_139421.148665435-570000000
5gene1318NW_139421.160666836-771000000
6gene1319NW_139421.172949483+2190000000
∙在这里我们只是需要 Geneid 和后 6 列的样本的 count 信息来组成矩阵,所以要处理下
>countMatrix
>rownames(countMatrix)
>head(countMatrix)