系列文章目录
生信分析第一步:R语言基础应用以及数据前处理
文章目录
- R包下载
- 使用GEOquery包下载原始数据
- 芯片数据读取
- GEOquery 下载并读取数据
- 提取GEO表达矩阵
- 提取GEO注释信息
- 提取GEO芯片样本及临床信息
前言
用最精简的代码展示生信分析的全部流程
一、提取GEO芯片样本及临床信息
#### 1 clinical data from pData ----
library(GEOquery)
# gse <- getGEO("GSE5327", destdir = "geo", getGPL = F)
# pd <- phenoData(gse[[1]]) phenoData用法不常见
gse1 <- getGEO(filename = "geo/GSE5327_series_matrix.txt.gz", getGPL = F )
pd1 <- pData(gse1)
#### 2 targets data from pData ----
GSE29450_sm <- getGEO(filename = "affymetrix/GSE29450/GSE29450_series_matrix.txt.gz",
getGPL = F)
library(tidyverse)
GSE29450_targets <- pData(GSE29450_sm) %>%
dplyr::select(sample_