KEGG基因富集分析

#kegg:基因功能存储在pathway数据库里
rm(list = ls())  ## 魔幻操作,一键清空~

load(file = 'deg.Rdata')

head(deg)

## 不同的阈值,筛选到的差异基因数量就不一样,后面的超几何分布检验结果就大相径庭。

logFC_t=1.5
deg=nrDEG

deg$g=ifelse(deg$P.Value>0.05,'stable',
             
             ifelse( deg$logFC > logFC_t,'UP',
                     
                     ifelse( deg$logFC < -logFC_t,'DOWN','stable') )
             
)

table(deg$g)

head(deg)

deg$symbol=rownames(deg)

library(ggplot2)

library(clusterProfiler)

library(org.Hs.eg.db)

df <- bitr(unique(deg$symbol), fromType = "SYMBOL",
           
           toType = c( "ENTREZID"),
           
           OrgDb = org.Hs.eg.db)

head(df)

DEG=deg

head(DEG)

#merge函数:将两个数据集合并
#用于指定依据哪个列合并,常用于当两个数据集公共列名不一样的时候;
DEG=merge(DEG,df,by.y='SYMBOL',by.x='symbol')

head(DEG)
#标注好的差异基因
save(DEG,file = 'anno_DEG.Rdata')





gene_up= DEG[DEG$g == 'UP','ENTREZID'] 

gene_down=DEG[DEG$g == 'DOWN','ENTREZID'] 

gene_diff=c(gene_up,gene_down)

gene_all=as.character(DEG[ ,'ENTREZID'] )

data(geneList, package="DOSE")

head(geneList)

boxplot(geneList)

boxplot(DEG$logFC)



geneList=DEG$logFC

names(geneList)=DEG$ENTREZID

geneList=sort(geneList,decreasing = T)





## KEGG pathway analysis

### 做KEGG数据集超几何分布检验分析,重点在结果的可视化及生物学意义的理解。
library(org.Hs.eg.db)
  • 5
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值