前言
最近课题需要一组支撑数据,Characterization of a Large Panel of Patient-Derived Tumor
Xenografts Representing the Clinical Heterogeneity of Human Colorectal Cancer 里面的EMTAB-
991,是基因表达的矩阵。
# 首先加载必要的包
library(ArrayExpress)
library(oligo)
二、下载芯片
这次需要的芯片是"E-TAM-991”,来自Characterization of a Large Panel of Patient-Derived Tumor Xenografts Representing the Clinical Heterogeneity of Human Colorectal Cancer. Clin Cancer Res 18, 5314–5328 (2012). 也就是保存在arrayexpress数据库。直接搜E-MTAM-991,可能会搜不到,但是不要紧,https://www.ebi.ac.uk/arrayexpress/experiments/E-MTAB-991/,直接跳转页面。
这些Files就是我们需要的,先下载下来吧。
1.用getAE()下载
dir.create("E-MTAB-991") # 建一个文件夹,把E-TAM-911的raw data下载到里面。
dir <- "E-MTAB-991"
anno_AE <- getAE("E-MTAB-991", path = dir, type = "raw")
getAE() 里面两个参数比较重要:1. type: raw表示只下载raw文件,processed表示只下载process文件,full表示都下载。2. extract: 默认TRUE。如果选FALSE,下载的zip文件不会自动解压缩。
2.用wget 下载
这种就比较麻烦了,但是有时候速度快。
wget https://www.ebi.ac.uk/arrayexpress/files/E-MTAB-991/E-MTAB-991.sdrf.txt
wget https://www.ebi.ac.uk/arrayexpress/files/E-MTAB-991/E-MTAB-991.sdrf.txt
wget https://www.ebi.ac.uk/arrayexpress/files/E-MTAB-991/E-MTAB-991.raw.1.zip
wget https://www.ebi.ac.uk/arrayexpress/files/E-MTAB-991/E-MTAB-991.raw.2.zip
wget https://www.ebi.ac.uk/arrayexpress/files/E-MTAB-991/E-MTAB-991.raw.3.zip
wget https://www.ebi.ac.uk/arrayexpress/files/E-MTAB-991/A-AFFY-113.adf.txt
代码如下(示例):
二、读取芯片数据
# 把样本对应的信息先读进去
raw_data_dir <- "E-MTAB-991"
sdrf_location