GEO处理总结

library(GEOquery)
library(limma)
gset <- getGEO('GSE76427', destdir=".",
               AnnotGPL = F,     ## 注释文件
               getGPL = F) 
a=gset[[1]]
dat1=exprs(a)
dim(dat1)

metadata=pData(a)

#转换ID#GPL3921	
library(hthgu133a.db)
ids=toTable(hthgu133aSYMBOL)
colnames(ids)=c('probe_id','symbol')  
ids=ids[ids$symbol != '',]
ids=ids[ids$probe_id %in%  rownames(dat1),]
dat1=dat1[ids$probe_id,] 
ids$median=apply(dat1,1,median) 
ids=ids[order(ids$symbol,ids$median,decreasing = T),]
ids=ids[!duplicated(ids$symbol),]
dat1=dat1[ids$probe_id,]
rownames(dat1)=ids$symbol
rt1 <- dat1
##GPL571
library(hgu133a2.db)
b=gset[[2]]
dat2=exprs(b)
id2=toTable(hgu133a2SYMBOL)
colnames(id2)=c('probe_id','symbol')  
id2=id2[id2$symbol != '',]
id2=id2[id2$probe_id %in%  rownames(dat2),]
dat2=dat2[id2$probe_id,] 
id2$median=apply(dat2,1,median) 
id2=id2[order(id2$symbol,id2$median,decreasing = T),]
id2=id2[!duplicated(id2$symbol),]
dat2=dat2[id2$probe_id,]
rownames(dat2)=id2$symbol
rt2 <- dat2
same <- intersect(row.names(rt2),row.names(rt1))
length(same)
rt <- cbind(rt2[same,],rt1[same,])

##标准化
boxplot(rt,las=2)
rt=normalizeBetweenArrays(rt)
boxplot(rt,las=2)
write.table(rt,file = 'GSE14520.txt',sep = '\t',quote = F)
###临床数据整理##
cli <- read.table('./00.data/03.GEO/GSE14520_Extra_Supplement.txt',sep = '\t',header = T,row.names = 1,check.names = F)
clinical <- cli[,c(1,8,9)]
table(clinical$`Tissue Type`)
clinical <- clinical[clinical$`Tissue Type`=='Tumor',]
clinical <- na.omit(clinical)
clinical$futime <- clinical$`Survival months`
clinical$fustat <- clinical$`Survival status`  
clinical <- clinical[,-c(1:3)]
clinical$futime <- clinical$futime/12
rt1 <- t(rt)
same1 <- intersect(row.names(clinical),row.names(rt1))
rt <- cbind(clinical[same1,],rt1[same1,])
save(rt,file = './00.data/03.GEO/GSE14520_input.RData')

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Geohash是一种用于将地理位置编码为字符串的方法。它通过将地球划分为网格并为每个网格分配唯一的编码来实现这一目的。Geohash编码是基于经度和纬度坐标的,将这些坐标转换为一串字符,以便更方便地进行存储和处理Geohash算法采用了二分法的思想,将地球划分为一个矩形网格。首先,将全球经度范围从-180到180,纬度范围从-90到90,划分为一个2x2的矩形格子。然后根据目标位置的经纬度值,判断它位于左上、右上、左下还是右下的格子中。接着,再将该格子划分为4个子格子,继续根据经纬度值判断目标位置所在的子格子。这个过程不断递归下去,直到达到所需的精度。最后,每个网格都会被赋予一个唯一的Geohash编码。 Geohash编码使用了一组基于32个字符的字符集,包括了0-9数字和字母b-z(去除了a、i、l、o)。编码的长度可以根据需要选择,较短的编码表示较大的区域,而较长的编码表示较小的区域。 使用Geohash编码,可以实现一些有趣的应用,例如地理位置搜索、附近的位置查找、地理位置聚类等。由于Geohash编码将地理位置转换为字符串,因此可以方便地在数据库中进行存储、索引和查询操作。 总结起来,Geohash是一种将地理位置编码为字符串的方法,通过将地球划分为网格并为每个网格分配唯一的编码来实现。它是一种方便存储和处理地理位置数据的方式,被广泛应用于地理信息系统和位置服务中。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值