R制作GSEA分析用gct和cls文件
具体操作点击这个
GSEA富集分析 - 界面操作
我们需要输入文件,手动准备很麻烦:
1. 样品表达量文件 .gct
2. 样品表型分类文件 .cls
先看看这两文件长什么样
1. 样品表达量文件 .gct
.gct为后缀。
文件第一行以“#1.2”开头;
文件第二行的第一列为基因个数、第二列为样品个数;
文件的第三行为表达谱的矩阵的title信息,
第一列为基因symbol/探针号,
第二列为基因/探针的描述信息,
第三列以后为样品id。
接下来的行对应每个基因/探针在每个样品中的表达信息。
文件以/t作为分隔符
2. 样品表型分类文件 .cls
---------------------------------------------------------------
# 【正式开始制作】
准备表达数据,去掉正常样本
rm(list = ls())options(stringsAsFactors = F)#加载load('总normalizeExp.Rdata')#赋值中间变量,【去掉正常样本!!!】exp
看一眼exp文件:
行是基因名(mRNA+ncRNA),列是374个肿瘤样本