GEO数据挖掘(R语言)
旧版本的R语言使用install.packages("包名")来安装所需要的包,然而有许多包都无法导入,所以有了以下安装语句:
source("http://bioconductor.org/biocLite.R")
biocLite()
最近在做一些生物信息分析相关的工作,所以需要用到R语言以及GEO数据库,R语言中有一个包叫GEOquery,在ubuntu用以上语句来安装一直出错,显示无法更新无法安装之类的(也有可能是R版本的问题),就换回到windows试试,安装成功了,然后就可以进行导入并使用了。
library(GEOquery)
Data<-getGEO("GSE76275",destdir = "./")
GEO数据库中的数据都有个GSE编号,按编号更换一下代码就可以了。
接下来把下下来的数据换成矩阵表达:
Data1 <- getGEO(filename="./GSE118527_series_matrix.txt.gz")
myMatrix <- Data1@assayData$exprs
myPDfile <- pData(phenoData(Data1))