包从文章目录
生信分析第一步:R语言基础应用以及数据前处理
文章目录
- R包下载
- 使用GEOquery包下载原始数据
- 芯片数据读取
- GEOquery 下载并读取数据
- 提取GEO表达矩阵
- 提取GEO注释信息
- 提取GEO芯片样本及临床信息
前言
用最精简的代码展示生信分析的全部流程
使用GEOquery 下载并读取数据
在R里使用GSE号和GEOquery
包从GEO数据库上直接下载是最推荐使用下载方式
代码框一为精简模式。使用以上代码就可以将GSE42872
数据下载到R里当前工作目录并赋值给eSet
,下载完成后要注意检查数据文件的完整性
代码框二为各种较为复杂的情况。
library(GEOquery)
eSet <- getGEO("GSE42872",
destdir = '.', #下载在当前目录
getGPL = F) #平台信息不要
1 加载包 ----
library(GEOquery)
# 需引用的文献
citation(package = "GEOquery")
2 getGEO 含单个数据集 GSE5327
GSE5327_1 <- getGEO(GEO = "GSE5327", destdir = "geo", getGPL =