GEO数据库表达矩阵和临床信息的简单提取(附:R软件的几个实用代码)(GSE12417)

##GEO数据库下载:
install.packages("BiocManager")
BiocManager::install("GEOquery")
library(GEOquery)
library(dplyr)
library(tidyverse)
gset=getGEO(GEO="GSE12417",destdir = ".",getGPL = F)#有3个数据集,以其中一个为例
e2=gset[["GSE12417-GPL96_series_matrix.txt.gz"]]

 

##S4对象提取的三种方法:
方法一:$或者@
exp=e2@assayData$exprs#表达矩阵
phe=e2@phenoData@data#临床信息
方法二:直接通过鼠标操作再粘贴
exp=e2@assayData[["exprs"]]
phe=e2@phenoData@data
方法三:用函数提取 提取表达矩阵(了解即可)
exp=exprs(e2)
pdata=pData(e2)#分组信息

R软件的几个实用代码:

##R包安装:3种方式
1.在CRAN 存储库的r包
install.packages("xxx")
2.在Bioconductor存储库中的r包
if(!requireNamespace("BiocManager",quietly = TRUE))
  install.packages("BiocManager")
BiocManager::install("GEOquery")
3.在GitHub储存库中r包
Install.packages("devtools")
library(devtools)
devtools::install_github("xxx")

##读取探针文件:官网下载相关文件
library(data.table)
anno=fread("GPL96-57554.txt",header =T,data.table = F)

##文件保存与加载:
save(gset,file = "gset.rdata")#保存
load("gset.rdata")#加载
saveRDS(gset,file = "gse12417.rds")#保存
x1=readRDS("gse12417.rds")#加载
 

##清空环境
rm(list=ls())    
##系统报错改为英文
Sys.setenv(LANGUAGE = "en")
##禁止转化为因子
options(stringsAsFactors = FALSE)

##cbind()函数将两个矩阵横向合并,要求被合并的两个矩阵具有相同的行数。rbind()函数将两个矩阵纵向合并,要求被合并的两个矩阵具有相同的列数。
##当出现一个探针对应多个基因名的情况下,表明探针不够特异,在此只保留第一个基因。
##行名rownames不可以重复,列名colnames可以重复。
##提取某一列的结果为向量,提取某多列的结果为数据框,提取某行的结果也是数据框。数据框的结构是各列聚合在一起。
 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值