从ArrayExpress数据库下载一个芯片做注释

本文介绍了如何从ArrayExpress数据库下载E-MTAB-991基因表达矩阵,并使用R语言进行读取和注释。通过getAE()函数和wget命令下载数据,接着解压缩并验证数据,最后对芯片数据进行注释处理。
摘要由CSDN通过智能技术生成


前言

最近课题需要一组支撑数据,Characterization of a Large Panel of Patient-Derived Tumor
Xenografts Representing the Clinical Heterogeneity of Human Colorectal Cancer 里面的EMTAB-
991,是基因表达的矩阵。


# 首先加载必要的包
library(ArrayExpress)
library(oligo)

二、下载芯片

这次需要的芯片是"E-TAM-991”,来自Characterization of a Large Panel of Patient-Derived Tumor Xenografts Representing the Clinical Heterogeneity of Human Colorectal Cancer. Clin Cancer Res 18, 5314–5328 (2012). 也就是保存在arrayexpress数据库。直接搜E-MTAM-991,可能会搜不到,但是不要紧,https://www.ebi.ac.uk/arrayexpress/experiments/E-MTAB-991/,直接跳转页面。
在这里插入图片描述
这些Files就是我们需要的,先下载下来吧。

1.用getAE()下载

dir.create("E-MTAB-991")  # 建一个文件夹,把E-TAM-911的raw data下载到里面。
dir <- "E-MTAB-991"
anno_AE <- getAE("E-MTAB-991", path = dir, type = "raw")

getAE() 里面两个参数比较重要:1. type: raw表示只下载raw文件,processed表示只下载process文件,full表示都下载。2. extract: 默认TRUE。如果选FALSE,下载的zip文件不会自动解压缩。

2.用wget 下载

这种就比较麻烦了,但是有时候速度快。

wget https://www.ebi.ac.uk/arrayexpress/files/E-MTAB-991/E-MTAB-991.sdrf.txt
wget https://www.ebi.ac.uk/arrayexpress/files/E-MTAB-991/E-MTAB-991.sdrf.txt
wget https://www.ebi.ac.uk/arrayexpress/files/E-MTAB-991/E-MTAB-991.raw.1.zip
wget https://www.ebi.ac.uk/arrayexpress/files/E-MTAB-991/E-MTAB-991.raw.2.zip
wget https://www.ebi.ac.uk/arrayexpress/files/E-MTAB-991/E-MTAB-991.raw.3.zip
wget https://www.ebi.ac.uk/arrayexpress/files/E-MTAB-991/A-AFFY-113.adf.txt

代码如下(示例):

二、读取芯片数据

# 把样本对应的信息先读进去
raw_data_dir <- "E-MTAB-991"
sdrf_location 
  • 4
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值