芯片数据分析步骤1 芯片数据下载-GEO

芯片数据分析 专栏收录该内容
8 篇文章 11 订阅

从GEO数据库下载数据的方法

1、在GEO DATASETS中输入关键词,选择符合的GSE,在ftp中进行手动下载

2、找到符合的GSE,在R中使用GEOquery包进行下载

GEO数据库的数据种类

1、Platforms 平台

包含有芯片的探针信息,如cDNAs,寡核苷酸,ORFs,抗体。

以GPLxxx编号。

一个platform可以包含不同人上传的不同sample。

不同platform的数据需要分开处理。

2、Samples 样品

一个以独立方式处理的样品。

以GSMxxx编号。

一个sample只能包含于一个platform,一个sample可以包含于多个series。

3、Series 系列

一个Series就是一个study。

以GSExxx编号。

一个系列一定包含多个sample,可能包含多个platform。

不同platform的数据需要分开处理。

4、Datasets 数据集

数据集包含有被summiter处理过的数据,可以使用GEO数据库自带的tools进行分析,如differentiated gene expression, cluster, heatmap。

以GDSxxx编号。

一个dataset的sample来自同一个platform,因此彼此间具有可比性。

范例

  • gds858 <- getGEO(‘GDS858’, destdir=“.”) ##根据GDS号来下载数据,下载soft文件

  • gpl96 <- getGEO(‘GPL96’, destdir=“.”) ##根据GPL号下载的是芯片设计的信息!

  • gse1009 <- getGEO(‘GSE1009’, destdir=“.”)##根据GSE号下载数据,下载_series_matrix.txt.gz

下载GDS返回的对象

gds858返回的对象很复杂

用Table(gds858)可以得到表达矩阵!

用Meta(gds858)可以得到描述信息

names(Meta(gds858))
Table(gds858)[1:5,1:5]

可以用 GDS2eSet 函数把它转变为 expressionset

下载GSE返回的对象

GPLList函数查看GPL信息

处理函数有:geneNames/sampleNames/pData/exprs

用命令

gsmplatforms <- lapply(GSMList(gse), function(x) {Meta(x)$platform_id})
head(gsmplatforms)

查看GSM对应的GPL信息

用命令

gsmlist = Filter(function(gsm) { Meta(gsm)$platform_id=='GPLXX'},GSMList(gse))

提取GPLXX对应的样本(有些实验涉及到不同平台的样品)。

下载GPL返回的对象

根据GPL号下载返回的对象跟GDS一样,也是用Table/Meta处理!

还可以下载cel原始文件!

tmp=getGEOSuppFiles(GSE1009)
if (is.null(tmp)) {
  warning("Supplementary data files not provided!\nyou should check this GEO ID in NCBI\n")
}

参考:

1、用GEOquery从GEO数据库下载数据

2、Using the GEOquery Package

3、GEOquery Reference Manual

  • 5
    点赞
  • 0
    评论
  • 40
    收藏
  • 打赏
    打赏
  • 扫一扫,分享海报

数字电路74全系列(270个)芯片手册技术手册数据手册资料合集: 7400.pdf 7401.pdf 7402.pdf 7403.pdf 7404.pdf 7406.pdf 7408.pdf 7409.pdf 7410.pdf 7411.pdf 74121.pdf 74132.pdf 7414.pdf 74153.pdf 74155.pdf 74180.pdf 74191.pdf 7420.pdf 7426.pdf 7427.pdf 7430.pdf 7432.pdf 7438.pdf 7445.pdf 7474.pdf 7475.pdf 7476.pdf 7485.pdf 7486.pdf 74HC00.pdf 74HC02.pdf 74HC03.pdf 74HC04.pdf 74HC05.pdf 74HC08.pdf 74HC107.pdf 74HC109A.pdf 74HC11.pdf 74HC112.pdf 74HC113.pdf 74HC123A.pdf 74HC125.pdf 74HC126.pdf 74HC132.pdf 74HC133.pdf 74HC137.pdf 74HC138.pdf 74HC139.pdf 74HC14.pdf 74HC147.pdf 74HC148.pdf 74HC149.pdf 74HC151.pdf 74HC153.pdf 74HC154.pdf 74HC155.pdf 74HC157.pdf 74HC161.pdf 74HC163.pdf 74HC164.pdf 74HC165.pdf 74HC166.pdf 74HC173.pdf 74HC174.pdf 74HC175.pdf 74HC181.pdf 74HC182.pdf 74HC190.pdf 74HC191.pdf 74HC192.pdf 74HC193.pdf 74HC194.pdf 74HC195.pdf 74HC20.pdf 74HC221A.pdf 74HC237.pdf 74HC242.pdf 74HC244.pdf 74HC251.pdf 74HC253.pdf 74HC257.pdf 74HC258.pdf 74HC259.pdf 74HC266A.pdf 74HC27.pdf 74HC273.pdf 74HC280.pdf 74HC283.pdf 74HC299.pdf 74HC30.pdf 74HC32.pdf 74HC34.pdf 74HC354.pdf 74HC356.pdf 74HC365.pdf 74HC366.pdf 74HC367.pdf 74HC368.pdf 74HC373.pdf 74HC374.pdf 74HC393.pdf 74HC4016.pdf 74HC4017.pdf 74HC4020.pdf 74HC4040.pdf 74HC4046.pdf 74HC4049.pdf 74HC4050.pdf 74HC4051.pdf 74HC4052.pdf 74HC4060.pdf 74HC4066.pdf 74HC4075.pdf 74HC42.pdf 74HC423A.pdf 74HC4511.pdf 74HC4514.pdf 74HC4543.pdf 74HC51.pdf 74HC521.pdf 74HC533.pdf 74HC534.pdf 74HC540.pdf 74HC541.pdf 74HC58.pdf 74HC589.pdf 74HC594.pdf 74HC595.pdf 74HC597.pdf 74HC620.pdf 74HC623.pdf 74HC640.pdf 74HC643.pdf 74HC646.pdf 74HC648.pdf 74HC688.pdf 74HC7266.pdf 74HC73.pdf 74HC74A.pdf 74HC75.pdf 74HC76.pdf 74HC85.pdf 74HC86.pdf 74HC942.pdf 74HC943.pdf 74LS00.pdf 74LS02.pdf 74LS03.pdf 74LS04.pdf 74LS05.pdf 74LS08.pdf 74LS09.pdf 74LS10.pdf 74LS109.pdf 74LS11.pdf 74LS112.pdf 74LS113.pdf 74LS114.pdf 74LS125.pdf 74LS136.pdf 74LS138.pdf 74LS139.pdf 74LS14.pdf 74LS151.pdf 74LS153.pdf 74LS155.pdf 74LS156.pdf 74LS157.pdf 74LS158.pdf 74LS160A.pdf 74LS161A.pdf 74LS
参与评论
请先登录 后发表评论~
©️2021 CSDN 皮肤主题: 编程工作室 设计师:CSDN官方博客 返回首页

打赏作者

tommyhechina

你的鼓励将是我创作的最大动力

¥2 ¥4 ¥6 ¥10 ¥20
输入1-500的整数
余额支付 (余额:-- )
扫码支付
扫码支付:¥2
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值