10Steps RNA-seq下游实践 03.29-04.01
1.数据来源:GSE~~~~
是某个蛋白唯一一个公开的RNA-seq数据
2.实践内容:
1.从上游得到的features counts转变为表达谱矩阵
2.样本相关性分析,PCA,correlation,(orz:虽然只有四个样本🐂🍺)
3.分别用DESeq2,edgeR,limma三种方法计算差异表达
4.三种方法的比较
5.根据3中的差异表达绘制火山图
6.绘制热图
7.GO分析
8.KEGG分析
9.GSESA分析
10.GSVA分析
3.代码来源
生信技能树,公开讲座,郑可老师
4.自己坑坑洼洼遇到的困难与debug
######1.最一开始的featurescount文件的处理
其列数较多:包含什么正负链,染色体,并且样本的名称也甚是复杂。为了能够整理成教程中那个仅有genename,样本(且名字简单)的格式,小袁同学翻了翻“孟孟”老师的R语言的PPT,将数据框删除了不必要的列(疯狂使用dat=dat[,-1],一列列的删除),并用数据框子集提取来为列名改值。
>mydata <- read.table("counts.txt", header = TRUE, quote = '\t',skip =1)
>sampleNames <- c("CA_1","CA_2","CA_3","CC_1","CC_2","CC_3")
>names(mydata)[7:12] <- sampleNames
>head(mydata