在之前我们的文章:TCGA数据挖掘(三):表达差异分析中,我们利用的是TCGAbiolinks包中的TCGAanalyze_DEA函数进行差异表达分析,我们也提到可以选择基于limma或edgeR包进行分析,TCGA数据挖掘(三):表达差异分析这一讲中我们利用的是edgeR包,之后我们在文章:TCGA数据挖掘(四):表达差异分析(2)和TCGA数据挖掘(四):表达差异分析(3)中分别也介绍了其他方法的差异分析,包括edgeR和DESeq包,今天这一讲,我们就利用TCGAbiolinks包中的TCGAanalyze_DEA函数基于limma包进行差异分析。
数据下载
基因表达数据的下载
数据下载代码和之前的一样,这里再提供一次。避免出错不知道原因。
setwd("E:\\BioInfoCloud\\TCGABiolinks\\case_study1")# 加载相应的包,可能会需要其他包,提示错误就安装缺少的包。# 因为每个人已经安装的包不一样。library(TCGAbiolinks)library(plyr)library(limma)library(biomaRt)library(SummarizedExperiment)# 请求数据。query "TCGA-BRCA", data.category = "Transcriptome Profiling", data.type = "Gene Expression Quantification", workflow.type = "HTSeq - Counts")# 从query中获取结果表,它可以选择带有cols参数的列,并使用rows参数返回若干行。# 1222个barcode samplesDown "cases"))# samplesDown中筛选出TP(主要实体瘤)样本的barcode# 1102个barcodedataSmTP typesample = "TP")# 113个barcodedataSmNT typesample = "NT")# 选择100个正常组织和100个肿瘤组织样本作为研究对象dataSmTP_short dataSmNT_short # 根据前面的筛选,再次请求数据queryDown "TCGA-BRCA",