问题
https://mp.weixin.qq.com/s/DgF0v1vQj65BPCvAFfZjQw
找出
- 人基因集的基因数量
- 小鼠基因集的基因数量
- 两个基因集overlap数量
- 人特有的基因数量
- 小鼠特有的基因数量
思路
将人鼠的基因转化为同源ID,使用同源id 来找overlap 和特异基因。没有对应的同源id,转化为gene symbol ,根据大小写来比较(虽然我觉得,找不到同源id,很大可能不是同源基因了,它们的gene symbol估计也不一样,不过以防万一,还是比较一下。。。)
library(homologene)
library(org.Hs.eg.db)
library(org.Mm.eg.db)
geneid2symbol <- function(gene.id, OrgDb){
id.df <- AnnotationDbi::select(OrgDb, keys = gene.id,
keytype = "ENTREZID",
columns = c("SYMBOL"))
return(id.df$SYMBOL)
}
Hs.Hid <- lapply(Hs.H, function(genes){
h.dat